M1 - Semestre 1 · Expert

Introduction au Traitement Automatique des Langues

Code UE
SMINF1F1
ECTS
2 ECTS
Volume horaire
14h CM - 0h TD - 6h TP
Parcours
Algorithmiques et Systèmes Intelligents, IA Sciences des Données et Santé, IA et Facteurs Humains
Type de carte
UE de la carte informatique
Prérequis
Non renseigné

Description du cours

Le Traitement Automatique des Langues (TAL) est le sous domaine de l’intelligence artificielle dont l’objectif est la modélisation de la langue écrite, c’est-à-dire son analyse, son interprétation et sa génération. Dans ce module, nous abordons l’étude du langage au niveau du mot selon les trois approches historiques du TAL : structuraliste, statistique et connexionniste (réseaux de neurones). Ainsi, nous abordons les différentes méthodes d’analyses lexicale et lexico-sémantique, en particulier, les modèles du langage au grain caractère, l’encodage des dictionnaires par automates et transducteurs finis, l’extraction et l’identification d’unités polylexicales, la détection automatique des entités nommées, les représentations ontologiques du langage et les espaces sémantiques latents dont les plongements lexicaux (embeddings). Lors des travaux pratiques, nous introduisons les bibliothèques standards du TAL, i.e. NLTK et SPACY avec le langage de programmation Python à partir d’une série d’exercices qui permettent d’analyser les textes, et de naviguer dans les ontologies et les espaces sémantiques continus. En particulier, l’ontologie WordNet et les plongements lexicaux word2vec, GloVe et FastText sont explorés.

Modalités d'évaluation

Session 1 :

  • Contrôle continu (CC1) : le contrôle continu consiste en la réalisation de deux mini-projets et d’une présentation d’un article scientifique par groupes de 4 étudiants.
  • Contrôle terminal (CT1) : le contrôle terminal consiste en un devoir sur table d’une durée de 2h (tous les supports de cours sont autorisés).
  • Note finale : la note finale est calculée de la façon suivante : 31 × CC1 + 32 × CT 1.

Session 2 :

  • Contrôle terminal (CT2) : le contrôle terminal consiste en un devoir sur table d’une durée de 2h (tous les supports de cours sont autorisés).
  • Note finale : la note finale est calculée de la façon suivante : 13 × CC1 + 32 × CT 2.