2023-2024 / INFO0953-1

Scripting interfaces for biological software and databases

Durée

20h Th, 50h TD

Nombre de crédits

 Master en bioinformatique et modélisation, à finalité8 crédits 

Enseignant

Denis Baurain, Pierre Tocquin

Coordinateur(s)

Denis Baurain

Langue(s) de l'unité d'enseignement

Langue anglaise

Organisation et évaluation

Enseignement au premier quadrimestre, examen en janvier

Horaire

Horaire en ligne

Unités d'enseignement prérequises et corequises

Les unités prérequises ou corequises sont présentées au sein de chaque programme

Contenus de l'unité d'enseignement

[MISE-A-JOUR EN 2023] Ce cours enseigne la programmation en langage Perl et la création et l'usage de bases de données relationnelles, dans le contexte des applications bioinformatiques.

1. Modern Perl

  • Variables (Scalars, Arrays, Hashes)
  • Opérateurs, Expressions booléennes, Contrôle de flux
  • Entrées/Sorties
  • Expressions régulières
  • One-liners
  • Fonctions
  • Références et structures de données enchâssées
  • Modules et Tests unitaires
  • Best of CPAN
  • Perl idiomatique - TIMTOWTDI
2. Bases de données & SQL

Les données : concepts généraux et intérêts de les structurer

Modéliser une base de données

  • Le modèle Entité-Association
  • Le modèle relationnel
  • La normalisation
  • Génération d'un schéma relationnel
Créer et manipuler une base de données, le langage SQL

  • Du modèle à la structure physique, le Data Definition Language (DDL)
  • Manipulation et interrogation de la base de données, le Data Modification Language (DML)
  • Requêtes simples
  • Requêtes complexes

Acquis d'apprentissage (objectifs d'apprentissage) de l'unité d'enseignement

Ce cours est le principal cours de progammation du Master BIM. Avec d'autres cours de ce cursus, il vise à ce que les étudiants soient capables d'utiliser l'ordinateur comme un instrument scientifique. Plus spécifiquement, ils auront été formés aux objectifs suivants :

1. Design expérimental

  • comment choisir les contrôles adéquats
  • comment raisonner dans un cadre statistique
2. Réalisation des expériences

  • comment lancer de grandes séries d'analyses
  • comment exploiter la puissance des grilles de calcul
3. Interprétation des résultats

  • comment automatiser l'analyse des fichiers de sortie
  • comment générer des graphes informatifs mais jolis
  • comment tirer des conclusions statistiquement fondées
4. Documentation et archivage

  • comment documenter les protocoles expérimentaux
  • comment réorganiser une série d'analyses a posteriori
  • comment gérer les multiples versions des jeux de données, des programmes utilisés et des résultats générés

Savoirs et compétences prérequis

Ce cours ne suppose aucune connaissance particulière en informatique, mais il s'appuie néanmoins sur les cours de Génomique [GENE0003-1], de Bioinformatique [BIOL0008-1] et l'introduction à l'environnement Linux et à la ligne de commande [INFO0960] du Master BBMC et Master BIM.

Activités d'apprentissage prévues et méthodes d'enseignement

  • mini-exposés théoriques
  • défis à résoudre
  • travaux pratiques sur ordinateur
  • autoformation (manuels et tutoriels en ligne)

Mode d'enseignement (présentiel, à distance, hybride)

Ce cours est essentiellement en présentiel, mais son approche par problèmes nécessitera du travail en dehors de la salle de classe.

Lectures recommandées ou obligatoires et notes de cours

Les syllabus au format papier seront distribués au cours. Des ouvrages de référence conseillés y seront mentionnés.

Modalités d'évaluation et critères

Examen(s) en session

Toutes sessions confondues

- En présentiel

évaluation écrite ( questions ouvertes )


Explications complémentaires:

Les deux parties du cours, Perl et Bases de données, font l'objet d'une évaluation séparée, chacune par un examen écrit, en présentiel. Les notes de Perl et de Bases de données représenteront respectivement 70% et 30% de la note finale.

1. Perl

L'évaluation de ce cours se basera à la fois sur le travail réalisé pendant l'année académique (devoirs : 25%), sur un examen à livre ouvert où un problème intégratif devra être résolu à l'aide de commandes shell et d'un programme Perl (75%).

2. Bases de données

L'évaluation consistera en la réalisation d'un problème intégratif. L'examen se déroulera à livre ouvert.

Stage(s)

Remarques organisationnelles et modifications principales apportées au cours

ATTENTION : Chaque étudiant de M-BIM doit se munir d'un ordinateur portable sur lequel il doit être possible d'installer un système Linux (type Ubuntu LTS). Les machines virtuelles interactives dans VirtualBox ne sont pas une solution fiable, mais WSL2 sur un Windows récent est envisageable, de même qu'un dual-boot avec Windows.

https://ubuntu.com/tutorials/install-ubuntu-on-wsl2-on-windows-11-with-gui-support

Contacts

Prof. Denis Baurain
Institut de Botanique B22 (P70)
denis.baurain@uliege.be

Dr. Pierre Tocquin
Institut de Botanique B22 (P70)
ptocquin@uliege.be

Mme Rosa Gago
rgago@uliege.be

Association d'un ou plusieurs MOOCs