M2 - Semestre 3 · Expert
Traitement automatique des langues avancé
- Code UE
- SMINF3E1
- ECTS
- 3 ECTS
- Volume horaire
- 20h CM - 0h TD - 10h TP
- Responsable(s)
- Parcours
- Algorithmiques et Systèmes Intelligents, IA et Facteurs Humains
- Type de carte
- UE de la carte informatique
- Prérequis
- Non renseigné
Description du cours
Dans ce module, nous abordons l’étude du langage naturel au niveau du texte selon les approches statistique et connexionniste. Ainsi, nous abordons les tâches historiques de TAL, à savoir le résumé de texte et la traduction automatique, en apportant un focus sur la cohérence textuelle. Nous abordons ensuite les techniques basées sur l’apprentissage profond pour traiter les textes longs (LongFormer). Nous abordons aussi la génération de textes par modèles de type encodeur-décodeur et décodeur seul. La notion d’émergence inhérente aux LLMs est introduite ainsi que l’apprentissage par renforcement humain, et les techniques d’ingénierie de prompt sont présentées. La génération augmentée par recherche (RAG) et les techniques efficientes d’affinage des LLMs (Prefix Tuning, LoRA) sont introduites. Finalement, certaines applications du TAL sont présentées comme la recherche d’information, les interfaces langagières ou le TAL appliqué à la santé mentale. Lors des travaux pratiques, nous travaillons sur la génération de textes à partir de modèles encodeur-décodeur ou décodeur seul. En particulier, nous implémentons des techniques d’affinage efficientes sur différents LLMs (e.g. mBART, T5, Mistral, Llama, DeepSeek).
Modalités d'évaluation
Session 1 :
- Contrôle continu (CC1) : le contrôle continu consiste en la réalisation d’un projet et d’une présentation d’un article scientifique par groupes de 4 étudiants.
- Contrôle terminal (CT1) : le contrôle terminal consiste en un devoir sur table d’une durée de 2h (tous les supports de cours sont autorisés).
- Note finale : la note finale est calculée de la façon suivante : 31 × CC1 + 32 × CT 1.
Session 2 :
- Contrôle terminal (CT2) : le contrôle terminal consiste en un devoir sur table d’une durée de 2h (tous les supports de cours sont autorisés).
- Note finale : la note finale est calculée de la façon suivante : 13 × CC1 + 32 × CT 2.
Guide Master Informatique


