2023-2024 / SPAT0086-1

Advanced data analysis in python and introduction to machine learning

Durée

15h Th, 25h Pr

Nombre de crédits

 Master en sciences spatiales, à finalité4 crédits 

Enseignant

Valentin Christiaens, Maxime Fays, Guy Munhoven, Dominique Sluse

Coordinateur(s)

Maxime Fays

Langue(s) de l'unité d'enseignement

Langue anglaise

Organisation et évaluation

Enseignement au deuxième quadrimestre

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Ce cours s'appuie sur les sujets couverts dans le cours SPAT0002 et les développe. Avec ce cours, l'étudiant aiguisera ses compétences en programmation Python et se familiarisera avec certaines des techniques les plus populaires utilisées pour l'analyse des données dans les sciences spatiales. En particulier, l'accent sera mis sur les techniques liées au Machine Learning, au traitement de séries temporelles et d'images. Le cours s'appuiera sur des diapositives et des Jupyter notebooks qui fourniront une explication concise des techniques examinées, ainsi qu'un (ou plusieurs) exercice(s) concret(s) généralement inspiré(s) de problèmes scientifiques réels.

Les cours se répartissent en trois parties principales :

  • Introduction à l'apprentissage automatique - Cette partie couvre les concepts importants de l'apprentissage automatique, comme, p. ex., les biais, l'underfitting et l'overfitting (sous-apprentissage et surapprentissage), validation croisée, matrices de confusion, ...), ainsi qu'à fournir un aperçu de certaines méthodes importantes utilisées pour l'apprentissage supervisé et non supervisé. En particulier, certains algorithmes parmi les plus populaires utilisés pour la réduction de la dimensionnalité, la classification, le regroupement et la régression seront présentés et expérimentés.
  • Analyse avancée des données - Cette partie étend l'analyse des séries temporelles introduite dans SPAT0002 (analyse de signaux périodiques et non périodiques), et couvre certains concepts de base du traitement des images (débruitage, filtrage, déconvolution).
  • Utilisation avancée de Python - Cette partie comprend l'utilisation des classes et la familiarisation avec les outils de développement.

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

  • Maîtrise des concepts importants et du "jargon" utilisés dans l'apprentissage automatique (biais, surajustement, matrice de confusion, ...).
  • Utiliser et appliquer les techniques standard d'apprentissage automatique à des ensembles de données et identifier la technique la mieux adaptée à un ensemble de données donné.
  • Maîtriser les outils nécessaires pour manipuler, nettoyer et vérifier de grands ensembles de données.
  • Utiliser des techniques avancées pour manipuler et interpréter le signal scientifique présent dans les images et les séries temporelles.
  • Construire un savoir-faire et une compréhension solides de la programmation python pour explorer, identifier et comprendre les solutions numériques à des problèmes qui ne sont pas enseignés pendant les cours magistraux.
  • Utiliser les outils adéquats pour le développement de projets et la programmation en python.

Savoirs et compétences prérequis

Cours SPAT0002-1 ou semblable.

Activités d'apprentissage prévues et méthodes d'enseignement

Le support du cours théorique est sous forme de notebooks Jupyter (http://jupyter.org) qui contiennent, en plus de la matière vue, des exemples et des petits exercices interactifs permettant aux étudiants une expérience directe des méthodes et notions présentées.
Les travaux pratiques sont consacrés à l'étude de problèmes plus avancés dont la résolution se fera à l'aide de librairies Python dans lesquelles plusieurs algorithmes vus au cours sont implémentés.

Mode d'enseignement (présentiel, à distance, hybride)

Cours donné exclusivement en présentiel

Lectures recommandées ou obligatoires et notes de cours

Le cours est basé sur du matériel provenant de diverses sources dont les références seront données à la fin de chaque notebook jupyter.


En outre, les ouvrages suivants seront également utilisés:

 

Modalités d'évaluation et critères

Examen(s) en session

Toutes sessions confondues

- En présentiel

évaluation écrite ( questions ouvertes ) ET évaluation orale

- En distanciel

évaluation écrite ( questions ouvertes ) ET évaluation orale


Explications complémentaires:

L'examen sera, dans la mesure du possible organisé en présentiel.

Stage(s)

Il n'y a pas de stage prévu dans le cadre de ce cours.

Remarques organisationnelles et modifications principales apportées au cours

Le cours sera donné à raison d'un séance de 4h par semaine, au second quadrimestre.

Contacts

Dominique Sluse
Université de Liège
Institut d'Astrophysique et de Géophysique (Bât. B5c)
17, allée du Six-Août
B-4000 Liège
Tél.: (+32) (4) 366 9797  (D. Sluse)

Association d'un ou plusieurs MOOCs

Aucun MOOC n'est associé à ce cours.

Notes en ligne

Dépot Github où les notes de cours sont postées
https://github.com/SPAT0086

Le dépôt "Ongoing" contient les notes de l'année académique en cours.