Le pôle scientifique CLCS de l’Université de Lorraine et le laboratoire ATILF ont accordé un financement au projet Annotation Lexicale : Une Mesure de Complexité Contextuelle (ALUMCoCo). Ce projet, porté par le GR PAL, réunira Lucie Barque, Mathieu Constant, Marianne Clausel, Nabil Gader, Richard Huyghe, Évelyne Jacquey, et moi-même du mois de février au mois […]

Aujourd’hui, j’ai animé une journée de formation auprès des étudiants de l’école doctorale SLTC de l’Université de Lorraine, dans le cadre de la formation Collecter et analyser des données en SHS. Nous avons abordé le cas particulier des données langagières et nous sommes attardés sur deux applications : la transcription de données orales et l’utilisation […]

Ce matin, avec Evelyne Jacquey, nous présentons nos avancées aux membres du groupe de recherche Polysémie et Ambiguïté Lexicale. Une expérience d’annotation de 269 occurrences du lemme soleil en sens du RL-fr et du TLF nous a permis de poser les bases d’une méthodologie pour extraire la structure polysémique d’une entrée du TLF, réaliser des […]

Aujourd’hui, nous avons eu le plaisir, avec Mathieu Constant, d’assister à la soutenance de stage de Clémentine BLEUZE. Clémentine a travaillé avec nous pendant près de 3 mois sur la question de l’ambiguïté lexicale. Elle a réalisé une série d’expériences de désambiguïsation automatique sur un ensemble de 25 couples de sens, associé à un corpus […]

À l’automne dernier, j’ai dispensé à distance un cours d’initiation à Perl pour le traitement de corpus. Les supports de ce cours sont désormais disponibles ici.

Nous accueillerons Aman Sinha dans quelques semaines au sein du projet BEL-RL-fr, où il réalisera quelques expériences de désambiguïsation lexicale basée sur nos ressources lexicales et textuelles. Est-il possible d’enrichir le BEL-RL-fr d’une annotation de qualité en s’appuyant sur une annotation semi-automatique en sens lexicaux ? Nos ressources sont-elles adaptées à l’automatisation de la désambiguïsation lexicale ? […]

Grâce à un coup de pouce avisé de l’équipe du projet Textométrie de l’ENS de Lyon, le BEL-RL-fr est désormais exploitable dans la plateforme TXM, en lieu et place de la version non structurée de la base d’exemples du RL-fr que nous y interrogions avant. Ce format sera disponible à tous lors de la prochaine […]

À l’occasion des journées scientifiques « Linguistique informatique, formelle et de terrain » (LIFT 2019), je présenterai la plateforme Allegro, jeudi 28 novembre, accompagnée de Benjamin Husson. À partir d’un poster, nous montrerons les applications actuellement basées sur cette plateforme et esquisserons quelques rouages techniques.