M1 - Semestre 1 · Expert
Introduction au Traitement Automatique des Langues
- Code UE
- SMINF1F1
- ECTS
- 2 ECTS
- Volume horaire
- 14h CM - 0h TD - 6h TP
- Responsable(s)
- Parcours
- Algorithmiques et Systèmes Intelligents, IA Sciences des Données et Santé, IA et Facteurs Humains
- Type de carte
- UE de la carte informatique
- Prérequis
- Non renseigné
Description du cours
Le Traitement Automatique des Langues (TAL) est le sous domaine de l’intelligence artificielle dont l’objectif est la modélisation de la langue écrite, c’est-à-dire son analyse, son interprétation et sa génération. Dans ce module, nous abordons l’étude du langage au niveau du mot selon les trois approches historiques du TAL : structuraliste, statistique et connexionniste (réseaux de neurones). Ainsi, nous abordons les différentes méthodes d’analyses lexicale et lexico-sémantique, en particulier, les modèles du langage au grain caractère, l’encodage des dictionnaires par automates et transducteurs finis, l’extraction et l’identification d’unités polylexicales, la détection automatique des entités nommées, les représentations ontologiques du langage et les espaces sémantiques latents dont les plongements lexicaux (embeddings). Lors des travaux pratiques, nous introduisons les bibliothèques standards du TAL, i.e. NLTK et SPACY avec le langage de programmation Python à partir d’une série d’exercices qui permettent d’analyser les textes, et de naviguer dans les ontologies et les espaces sémantiques continus. En particulier, l’ontologie WordNet et les plongements lexicaux word2vec, GloVe et FastText sont explorés.
Modalités d'évaluation
Session 1 :
- Contrôle continu (CC1) : le contrôle continu consiste en la réalisation de deux mini-projets et d’une présentation d’un article scientifique par groupes de 4 étudiants.
- Contrôle terminal (CT1) : le contrôle terminal consiste en un devoir sur table d’une durée de 2h (tous les supports de cours sont autorisés).
- Note finale : la note finale est calculée de la façon suivante : 31 × CC1 + 32 × CT 1.
Session 2 :
- Contrôle terminal (CT2) : le contrôle terminal consiste en un devoir sur table d’une durée de 2h (tous les supports de cours sont autorisés).
- Note finale : la note finale est calculée de la façon suivante : 13 × CC1 + 32 × CT 2.
Guide Master Informatique


