M2 - Semestre 3 · Avancé

Fouille déclarative de données

Code UE
SMINF3E5
ECTS
3 ECTS
Volume horaire
20 CM - 0 TD - 10 TP
Parcours
Algorithmiques et Systèmes Intelligents
Type de carte
UE de la carte informatique
Prérequis
Non renseigné

Description du cours

Ce cours comporte trois parties :

  • Une introduction des différents problèmes et tâches liés à l’extraction de motifs et au clustering à partir des données, allant du pattern mining classique à la fouille interactive, en passant par l’intégration de contraintes pour identifier des motifs locaux pertinents, jusqu’aux approches récentes comme l’uplift qui visent à mesurer l’impact différencié des motifs sur des sous-populations.
  • L’extraction de motifs sous contraintes vise à découvrir des régularités pertinentes dans les données tout en respectant des conditions imposées par l’utilisateur. Des approches déclaratives, comme la programmation par contraintes et la programmation linéaire, permettent d’exprimer ces conditions de manière flexible et générique. Elles offrent un cadre unifié où la recherche de motifs est déléguée à des solveurs puissants, garantissant efficacité et expressivité. Une présentation des principales méthodes déclaratives de l’état de l’art est proposée.
  • L’analyse formelle de concepts est une méthode pour extraire et organiser les relations entre objets et attributs en un treillis de concepts, représentant hiérarchiquement les généralisations et spécialisations possibles. Ces treillis offrent une structure canonique des connaissances contenues dans les données. La redescription consiste à exprimer un même ensemble d’objets par différentes descriptions, facilitant la comparaison et l’intégration de points de vue multiples. Les principales approches et méthodes issues de l’état de l’art sont passées en revue.

Modalités d'évaluation

Évaluation Continue Intégrale :

  • Contrôle continu (CC1) : un contrôle sur l’extraction de motifs avec des approches déclaratives.
  • Contrôle continu (CC2) : un contrôle sur l’extraction de motifs avec des approches spécialisées.
  • Contrôle continu (CC3) : un contrôle sur l’analyse formelle de concepts.
  • Note finale : la note finale est calculée de la façon suivante : max((CC1 + CC2)/2, (CC1 + CC2 + CC3)/3).