M1 - Semestre 1 · Avancé
Ingénierie des données
- Code UE
- SMINF1E3
- ECTS
- 3 ECTS
- Volume horaire
- 30 CM
- Responsable(s)
- Parcours
- Algorithmiques et Systèmes Intelligents
- Type de carte
- UE de la carte informatique
- Prérequis
- Non renseigné
Description du cours
Ce cours explore les techniques fondamentales et avancées permettant d’extraire du sens à partir de données non structurées et multimodales, telles que le texte et l’image. Il débute par l’ingénierie des données textuelles, avec la création de dictionnaires et d’index, suivie par la présentation de méthodes de recherche, notamment les recherches tolérantes aux erreurs et les techniques de classement. L’analyse temporelle dans l’exploration de données est également abordée, tout comme l’introduction aux algorithmes d’apprentissage supervisé, notamment les machines à vecteurs de support (SVM) et les arbres de décision. Une partie importante du cours est consacrée aux méthodes de partitionnement de données. Sont présentés les algorithmes de clustering tels que K-means et ses variantes (GK-means, K-means++), le clustering hiérarchique, ainsi que le clustering par densité avec DBSCAN. Ces méthodes sont accompagnées d’un exposé sur les différentes métriques d’évaluation, incluant les indices internes (comme la cohésion et la séparation) et les indices externes (comme la pureté ou la mesure F). Le cours met également l’accent sur la recherche d’images et de vidéos basée sur le contenu, en lien avec des aspects de conception d’interfaces utilisateur. Un chapitre est spécifiquement dédié aux interfaces des moteurs de recherche, qui permettent un accès efficace aux données découvertes. Certains CMs sont accompagnés d’exemples d’exercices qui servent de préparation au CT. Les exercices du CT sont similaires, d’un point de vue conceptuel, à ceux présentés précédemment.
Modalités d'évaluation
Session 1 :
- Contrôle terminal : le contrôle terminal consiste en un devoir sur table d’une durée de 2h (aucun support ne sera autorisé)
- Note finale : 100% CT1
Session 2 :
- Contrôle terminal : le contrôle terminal consiste en un devoir sur table d’une durée de 2h (aucun support ne sera autorisé)
- Note finale : 100% CT2
Guide Master Informatique


