M1 - Semestre 2 · Expert

Analytique du web et confidentialité

Code UE
SMINF2F9
ECTS
2 ECTS
Volume horaire
20 CM
Responsable(s)
Parcours
Algorithmiques et Systèmes Intelligents
Type de carte
UE de la carte informatique
Prérequis
Non renseigné

Description du cours

Ce cours présente les méthodes d’analyse du Web, allant de l’analyse syntaxique à l’analyse sémantique du contenu. En plus, les contenus Web adverses et les fermes de spam sont présentés. Enfin, les techniques de suivi des utilisateurs dans le contexte de la confidentialité et de la protection de la vie privée sont étudiées. À cette fin, dans un premier temps, des cas d’utilisation des médias sociaux sont examinés afin d’étudier la confidentialité basée sur les évaluations de la frite d’un ami. Ensuite, l’analyse purement syntaxique du contenu du Web est présentée. Bien que l’efficacité de cette méthode soit évidente, ses limites sont mises en évidence et l’analyse sémantique du contenu du Web est présentée comme une approche complémentaire. Dans le même ordre d’idées, la nécessité et les méthodes de suivi des événements sont présentées. À cette fin, les analyses sont portées au niveau de l’entité, de sorte que l’ensemble de l’approche est agnostique sur le plan linguistique. En outre, on étudie l’impact des contenus Web adverses. Ainsi, les topologies des fermes de spam conçues pour manipuler le score PageRank d’un site web sont étudiées. En outre, une analyse des contenus Web basée sur l’archivage Web temporellement cohérent est introduite. Enfin, les techniques de suivi des utilisateurs dans le contexte de la confidentialité et de la protection de la vie privée sont étudiées. Les CMs sont accompagnés d’exemples d’exercices qui servent de préparation au CT. Les exercices du CT sont similaires, d’un point de vue conceptuel, à ceux présentés précédemment.

Modalités d'évaluation

Session 1 :

  • Contrôle terminal : le contrôle terminal consiste en un devoir sur table d’une durée de 2h (aucun support sera autorisé)
  • Note finale : 100% CT1

Session 2 :

  • Contrôle terminal : le contrôle terminal consiste en un devoir sur table d’une durée de 2h (aucun support sera autorisé)
  • Note finale : 100% CT2