Consortium

AGORA (Université de Cergy-Pontoise) – L’équipe Discours, communication, médias apportera son expertise en AD. Forte d’une expérience d’analyse de contextes discursifs différents (politiques, médiatiques, interactions verbales, écrits scolaires), elle contribuera à la recension de marqueurs / formes linguistiques candidates à des implémentations automatisées, ainsi qu’à production d’hypothèses discursives destinées à un outillage adéquat de sujets sociaux en lien avec la nomination. S’appuyant sur plusieurs projets financés autour de l’analyse de discours politiques ou médiatiques notamment, par le prisme de problématiques telles que l’idéologie, les controverses, la catégorisation sociale, elle apportera son savoir-faire en traitement qualitatif des données textuelles et dans la réponse à la demande sociale.

LI (Université de Tours) – L’équipe BDTLN apportera ses compétences en TAL en matière de détection des entités nommées, de résolution des coréférences et d’analyse des entités polylexicales (MWE). Son expérience dans ces domaines est reconnue : co-pilotage du réseau COST PARSEME (MWE), vainqueur de la campagne ETAPE sur les entités nommées, constitution du corpus ANCOR, plus grand corpus mondial de parole transcrite et annotée en coréférence ANCOR. Le LI travaille à l’heure actuelle au développement d’un système de résolution des coréférences entraîné sur ce corpus et participe à l’ANR DEMOCRAT sur les coréférences dans les corpus écrits.

ERTIM (INALCO) – L’équipe ERTIM, spécialisée en TAL et en textométrie, apportera ses compétences sur les deux aspects du projet (AD et TAL), ayant déjà mené des travaux sur l’utilisation combinée de sémantique, de la textométrie et du machine learning, par exemple en fouille d’opinion. Elle dispose également d’un savoir-faire en reconnaissance des entités nommées et d’outils dédiés à cette tâche (mXS) et les complète par des méthodes pour leur liaison à des bases de connaissances. Par son positionnement scientifique, l’équipe apporte un point de vue critique aux méthodes et objectifs qui relèvent à la fois de la linguistique (AD) et de l’informatique (TAL).

Reticular Project – L’entreprise Reticular propose des services de veille à destination à des décideurs publics, politiques, dirigeants d’entreprise, etc. Ils incluent une cartographie des acteurs (entités ou personnes), la mise en évidence de liens organiques (filiale, autorité, concurrence, partenariat, alliance) à leur proximité d’opinion dans le débat public. L’entreprise fournira des données issues d’une collecte semi-automatique réalisée au moyen d’un outil développé en interne. En matière de transfert technologique, l’entreprise intégrera des outils d’analyse du discours pour proposer des cartographies et analyses à ses clients. Ceux-ci permettront d’identifier les rôles que jouent les parties prenantes dans des débats publics (concepteurs de doctrine, vulgarisateurs, relais d’opinion / influenceurs, nouveaux convertis, fans, supporters, etc.). Ainsi, les analystes auront des moyens objectifs pour classer les intervenants par proximité de point de vue et par rôle dans la chaîne de diffusion, pour déterminer le degré de propagation d’un discours dans l’opinion publique ou dans un cénacle de spécialistes.

UMR 5267 PRAXILING (Université Montpellier 3, CNRS) – PRAXILING conduit des travaux sur les discours écrits, oraux et multimodaux appréhendés dans les conditions concrètes de leur production. Le personnel impliqué se situe au croisement des deux disciplines (AD et TAL) et peut se prévaloir d’une expérience consolidée dans des analyses outillées des corpus (textométrie, approches symboliques et hybrides), en particulier pour l’étude des controverses et de la nomination.