2023-2024 / DATS0001-1

Foundations of data science

Durée

30h Th, 60h Proj.

Nombre de crédits

 Master en science des données, à finalité5 crédits 
 Master : ingénieur civil en science des données, à finalité5 crédits 

Enseignant

Gilles Louppe

Langue(s) de l'unité d'enseignement

Langue anglaise

Organisation et évaluation

Enseignement au premier quadrimestre, examen en janvier

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

Data science is rooted in a rigorous and systematic methodology for understanding and interpreting data. This course seeks to instil the foundational principles of data science, with a particular emphasis on the scientific method and the iterative process of Bayesian modelling. Our perspective is that models are built iteratively: We build a model, use it to analyze data, assess how it succeeds and fails, revise it based on insights, and repeat. 

The lectures will closely follow each step of this loop (tentative and subject to change):

- Lecture 1: Build, compute, critique, repeat
- Lecture 2: Data 
- Lecture 3: Visualization
- Lecture 4: Latent variable models
- Lecture 5: Expectation-maximization
- Lecture 6: Variational inference
- Lecture 7: MCMC
- Lecture 8: Model criticism
- Lecture 9: Wrap-up case study

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

At the end of the course, the student will have gained the necessary experience, both theoretical and hands-on, for solving data-analysis problems. He/she will have acquired and practised the scientific method at the core of data science, including the representation, manipulation and visualization of the data, the design and use of Bayesian probabilistic models, their iterative criticism and improvement, as well as their applications for answering questions, claiming discoveries or making decisions. 

Savoirs et compétences prérequis

Programming experience. Probability and statistics. Elements of artificial intelligence.

Activités d'apprentissage prévues et méthodes d'enseignement

- Lectures, with live coding sessions
- Reading assignments
- Homeworks

Mode d'enseignement (présentiel, à distance, hybride)

Cours donné exclusivement en présentiel


Explications complémentaires:

Lectures are taught face-to-face. Homeworks are carried out remotely.

Lectures recommandées ou obligatoires et notes de cours

Materials will be made publicly available on GitHub during the semester.

Modalités d'évaluation et critères

Examen(s) en session

Toutes sessions confondues

- En présentiel

évaluation orale

Travail à rendre - rapport


Explications complémentaires:

The evaluation is divided into the following units:

- Homeworks
- Exam (data science study)

Stage(s)

Remarques organisationnelles et modifications principales apportées au cours

The course hub is available at https://github.com/glouppe/dats0001-foundations-of-data-science

Contacts

Gilles Louppe (g.louppe@uliege.be)

Association d'un ou plusieurs MOOCs