Sujet de thèse pour un.e doctorant.e AD/TAL

Recrutement d’un-e doctorant-e à l’interface de l’Analyse du discours (AD) et du Traitement automatique des langues (TAL), 36 mois

Projet ANR TALAD (AGORA, ERTIM, LI, PRAXILING): https://web.u-cergy.fr/anr-talad/

Direction: Julien Longhi (AGORA, université Paris Seine) et Damien Nouvel (ERTIM, Inalco)

Début souhaité: sept ou oct 2018

Contexte:

Le contexte de la thèse se situe dans la perspective de travaux sur l’interprétation automatisée de manifestations complexes de faits de discours non saisissables par les méthodes actuelles de l’AD dans des données issues de transcription d’interviews politiques. Il se focalise sur le mécanisme linguistique de la « nomination », en lien avec les concepts de dénomination, désignation, référenciation. Il s’agit en particulier, à partir d’un travail théorique et descriptif de faits de discours, de procéder à des prototypages, implémentations, expérimentations et validations d’approches pour la détection et caractérisation des nominations en lien avec les traitements développés par les équipes TAL du projet TALAD.

Enjeux de la thèse:

En particulier, la personne recrutée exploitera les sorties des reconnaissances d’entités et de coréférences, afin de déterminer leur apport pour un système expérimental de focalisé sur les nominations. Un retour sera fait à chaque traitement TAL afin d’évaluer son apport dans la reconnaissance des nominations, dans une optique d’intégration aux outils traditionnels de l’AD. Un des enjeux de cette thèse est aussi de proposer un système de classification pour l’entreprise Reticular afin de qualifier différents acteurs de la vie politique. En effet, Reticular s’intéresse à la qualification des acteurs comme des « concepteurs de doctrine », des « vulgarisateurs », des « relais d’opinion » (parfois « influenceurs ») et des « nouveaux convertis », « fans », ou encore « supporters ». Il s’agira ainsi de s’appuyer sur les marques identifiées formellement par les techniques TAL pour contribuer à caractériser les acteurs, non pas par leur « dit », mais par leur « (manière de) dire ».  Le doctorant recruté sera essentiellement en charge d’exploiter les annotation et traitements réalisés par les partenaires du projet pour développer un système de détection de caractérisation des nominations.

Profil recherché:

La personne recrutée devra avoir de solides compétences en TAL (informatique, fouille de données apprentissage automatique) et une bonnes compréhension de l’analyse du discours « outillée » et des enjeux de l’AD. Les candidatures d’étudiants ou de titulaires de M2 en linguistique/sciences du langage, TAL, fouille de données sont les bienvenues. Outre les compétences attendues, l’ouverture et l’intérêt des candidats pour la dimension interdisciplinaire du projet sera prise en compte.

Lieux de travail:

La personne recrutée sera accueillie à l’université Paris Seine (Cergy-Pontoise) et à l’INALCO

Contacts: julien.longhi@u-cergy.fr et damien.nouvel@inalco.fr

Rémunération: 1.900 euros soit un net d’environ 1.550 euros. Possibilité de solliciter une mission doctorale d’enseignement pour les années 2 et 3.