M1 - Semestre 2 · Expert

Traitement Automatique des Langues

Code UE
SMINF2F6
ECTS
2 ECTS
Volume horaire
14h CM - 0h TD - 6h TP
Parcours
Algorithmiques et Systèmes Intelligents, IA Sciences des Données et Santé, IA et Facteurs Humains
Type de carte
UE de la carte informatique
Prérequis
Non renseigné

Description du cours

Dans ce module, nous abordons l’étude du langage naturel au niveau de la phrase selon les trois approches historiques du TAL : structuraliste, statistique et connexionniste. Ainsi, nous abordons les différentes méthodes d’analyses morpho-syntaxique, syntaxique, et sémantique. Selon l’approche structuraliste, nous présentons les grammaires de constituants et les grammaires de dépendances. Les étiqueteurs morphosyntaxiques sont ensuite introduits selon l’approche statistique avec les modèles de Markov cachés. Les modèles du langage au niveau mot sont présentés selon l’approche statistique et l’approche connexionniste à partir des architectures de réseaux récurrents (LSTM, BiLSTM) et des transformeurs. Pour finir, les modèles fondation pré-entraı̂nés sont introduits (BERT, GPT), qui sont à la base de Large Language Models. Lors des travaux pratiques, nous travaillons sur la classification de textes en comparant les approches statistiques et les approches neuronales avec initialisation par plongements lexicaux (e.g. word2vec, GloVe, FastText). Nous implémentons ensuite les techniques d’affinage sur différentes variantes du modèle fondation BERT. En particulier, nous nous plaçons dans le cadre d’un apprentissage multiclasses ou multilabels.

Modalités d'évaluation

Session 1 :

  • Contrôle continu (CC1) : le contrôle continu consiste en la réalisation de deux mini-projets et d’une présentation d’un article scientifique par groupes de 4 étudiants.
  • Contrôle terminal (CT1) : le contrôle terminal consiste en un devoir sur table d’une durée de 2h (tous les supports de cours sont autorisés).
  • Note finale : la note finale est calculée de la façon suivante : 31 × CC1 + 32 × CT 1.

Session 2 :

  • Contrôle terminal (CT2) : le contrôle terminal consiste en un devoir sur table d’une durée de 2h (tous les supports de cours sont autorisés).
  • Note finale : la note finale est calculée de la façon suivante : 13 × CC1 + 32 × CT 2.