Contrat post-doctoral – chercheur(e) en TAL

Contrat post-doctoral – chercheur(e) en TAL

Recrutement

Intitulé du poste : chercheur en TAL (Traitement automatique des langues)

Catégorie : contrat post-doctoral

Durée : 18 mois

Prise de fonction : 1er février 2019

Structure de référence : Laboratoire Praxiling – UMR 5267 CNRS – Université Paul-Valéry Montpellier 3

Localisation géographique : Université Paul-Valéry, Route de Mende, ITIC, bât E, Montpellier

Rémunération : environ 1950 € (net)

Contexte 

Ce post-doctorat de 18 mois s’inscrit dans le cadre du projet ANR TALAD « Analyse et traitement automatique de discours » impliquant AGORA EA7392 (Université Cergy Pontoise), ERTIM (Inalco), LI (Université de Tours), PRAXILING (Université Paul-Valéry) et la société RETICULAR PROJECT (Paris).

À l’intersection entre analyse de discours (AD) et traitement automatique des langues (TAL), le projet TALAD s’intéresse à la théorisation et la modélisation des dynamiques langagières complexes mobilisées par l’acte de référence. Ses travaux visent notamment le repérage automatique des différentes formes de nominations, dénominations et désignations, porteuses de points de vue et d’opinions dans des textes.

Pour une présentation plus ample du projet voir : http://www.agence-nationale-recherche.fr/Projet-ANR-17-CE38-0012

Objectifs

La personne recrutée aura pour mission principale la définition et la structuration, à l’aide d’une ontologie, des connaissances linguistiques relatives à la référence et à la nomination (à partir d’un premier thésaurus construit à cet effet dans le projet). Elle prendra en charge la conception de schémas d’annotation de corpus à l’aide des concepts de l’ontologie et supervisera la tâche de production de corpus annotés. A cet effet, en parallèle à l’annotation manuelle, de nouvelles méthodes d’annotation semi-automatiques, inspirées de l’active learning, pourront être explorées.

Le ou la post-doctorant.e sera responsable de la validation et de la distribution de l’ensemble des modèles et des ressources, assortis de recommandations méthodologiques sur les pratiques d’analyse qui auront été définies dans le projet.

Une attention particulière sera portée aux liens qui pourront être établis entre la dénomination et deux autres phénomènes linguistiques partiellement opérationnels en TAL : les entités nommées et les coréférences. L’objectif étant d’appuyer, autant que possible, le repérage et la caractérisation des dénominations à l’aide de modules de désambiguïsation et de liaison d’entités et de recherche des chaînes de coréférence dans des textes.

En dialogue avec l’ensemble des participants du projet, le/la post-doctorant.e mènera une réflexion plus générale sur (i) l’interaction scientifique, méthodologique et technologique entre les communautés de l’AD et du TAL , (ii) l’appariement entre une sémantique de la nomination ainsi rendue opératoire et les besoins réels en veille politique et sociétale.

Profil recherché

Etre titulaire d’une thèse de doctorat en TAL, en informatique ou en linguistique informatique.

Maîtriser les techniques de traitement des langues naturelles et/ou les standards de modélisation des connaissances à l’aide d’ontologies (OWL, SKOS, Lexical Markup Framework – LMF, Lexicon Model for Ontologies – LEMON).

Personnes à contacter pour tout renseignement

Agata JACKIEWICZ, PRAXILING Montpellier 3 : agata.jackiewicz@univ-montp3.fr

Francesca FRONTINI, PRAXILING Montpellier 3 : francesca.frontini@univ-montp3.fr

Dépôt de candidature

https://emploi.cnrs.fr/Offres/CDD/UMR5267-AGAJAC-001/Default.aspx