Polysémie et Ambiguïté Lexicale

Sigle : GR PAL
Responsable : Sandrine Ollinger
Membres internes : Mathieu Constant, Évelyne Jacquey, Laurence Kister, Veronika Lux-Pogodalla, Sandrine Ollinger, Alain Polguère
Membres extérieurs : Lucie Barque, Paolo Frassi, Richard Huyghe
Invité·es permanent·es : Jessika Cardinali, Hee-Soo Choi, Nabil Gader, Benjamin Husson, Younghyun Ha, Anja Smith
Mots-clés : Polysémie, ambiguïté, ambiguïté lexicale, annotation, désambiguïsation automatique
Axes : LEX, MRI – TER (secondaire)

Liens externes : Espace privé

Projet en cours : ARTIST, ALIVoLex, ALUMCoCo

Description :
Le groupe de recherche Polysémie et ambiguïté lexicale fait suite au projet BEL-RL-fr initié en 2018 et se nourrit de projets menés au sein de l’ATILF depuis 2011 sur les questions de modélisation du lexique (RELIEF, Systèmes Lexicaux), d’enseignement du lexique (Lexisciences, Lexicollège, LELREP) et d’annotation de corpus (ASTTIC, TermITH, CoReA2D). Il a pour objectif principal une réflexion conjointe sur la modélisation de la polysémie et la levée d’ambiguïté lexicale en contexte.

Le projet BEL-RL-fr a permis la mise à disposition du corpus éponyme de citations lexicographiques du Réseau Lexical du français (RL-fr). Dans son état courant, ce corpus de 1,3 million de mots comporte 31 781 citations, à l’intérieur desquelles 52 600 segments textuels ont été manuellement associés à 27 745 unités lexicales. Tout comme le RL-fr lui-même, le corpus évolue quotidiennement et sa distribution sur la plateforme ORTOLANG fait l’objet de mises à jour annuelles.

Le corpus BEL-RL-fr a été utilisé pour mener de premières expériences de levée d’ambiguïté lexicale automatique à base de réseau de neurones. Outre les résultats encourageants obtenus grâce à l’intégration de connaissances linguistiques issues du RL-fr, ces expériences ouvrent de nombreuses pistes de réflexion sur l’exploitation de la modélisation du sens lexical proposée par les Systèmes Lexicaux et l’évaluation des résultats de la désambiguïsation automatique.

Si chaque citation du corpus BEL-RL-fr comporte 1 à 12 segments textuels associés à une unité lexicale du RL-fr, chaque occurrence des unités lexicales du RL-fr présente dans le BEL-RL-fr n’a pas été désambiguïsée. On trouvera ainsi 255 occurrences du lemme SOLEIL dans le corpus, pour seulement 45 occurrences liées à une entrée du RL-fr. Une première expérience de levée d’ambiguïté lexicale manuelle a été menée pour enrichir le corpus. Elle a permis d’identifier nos besoins pour une campagne de plus grande ampleur, qui visera la création de trois couches d’annotation distinctes : unités lexicales du RL-fr, acceptions du TLF, descripteurs d’ambiguïté.

Ces deux chantiers seront complétés par la poursuite de travaux de terrain sur l’enseignement de la polysémie. En travaillant conjointement sur des sous-parties du lexique du français, nous porterons une attention particulière aux phénomènes lexicaux qui entravent l’apprentissage scolaire ou automatique et chercherons à affiner leur modélisation.

Le groupe entretient des liens avec GR Lexicologie des réseaux lexicaux avec lequel il mutualisera des réunions de travail lexicographique et l’avancement des travaux sur l’enseignement du lexique.

Planning

▼ 2026

07.11.2026 Méthodes de prédiction automatique de la complexité lexicale Mathieu Constant

08.07.2026 Présentation livre fonctions lexicales Alain Polguère

23.04.2026 Formation Zotero Alexis Coutant

24.03.2026 Bibliographie sous Zotero Virginie Moulla

18.02.2026 Présentation du GR Stage immersion de professeurs en laboratoire Sandrine Ollinger

03.03.2026 Présentation des travaux du GR PAL
Manuel vs. automatique
Pistes de collaboration autour de la difficulté de la tâche d'annotation en sens lexicaux Benjamin Husson
Sandrine Ollinger
Aman Sinha

01.03.2026 Début stage « Classification non supervisée de l’inventaire des définitions du TLFi » Victor (Chenhan) GAO
Mathieu Constant
Benjamin Husson

▼ 2025

16.12.2025 Réunion d'échanges et d'information

14.11.2025 Phraséographie bilingue d'unités pragmatiques du discours. Questions théoriques et méthodologiques. Anja Smith

01.07.2025 Usage pragmatique des expressions honorifiques coréennes - sugohasieossseubnida et gosaenghasieossseubnida Younghyun Ha

29.04.2025 Fonctions sémantico-pragmatiques dans
le discours spécialisé Ioana Buhnila

28.04.2025 Enquête ALUMCoCo Sandrine Ollinger

01.04.2025 Référence et annotation lexicale Évelyne Jacquey & Laurence Kister

12.02.25 Présentation du GR Stage immersion de professeurs en laboratoire Sandrine Ollinger

03.02.2025 La prédiction de liens peut-elle enrichir des
graphes lexico-sémantiques du français ? Hee-Soo Choi

14.01.2025 Réunion d'échanges et d'information

▼ 2024

27.05.2024 Remarques sur l’enseignement/apprentissage des termes polysémiques Paolo Frassi

22.03.2024 Pré-campagne d'annotation : Apprendre à regarder ensemble dans la même direction
JTTA corpus Sandrine Ollinger & Évelyne Jacquey

18.03.2024 Réunion de lancement ALUMCoCo

01.02.2024 Référence et chaînes de références Laurence Kister

▼ 2022-2023

21.12.2023 Réunion d'échanges et d'information

13.11.2023 Les difficultés inhérentes à la tâche de classification sémantique : étude statistique des facteurs linguistiques expliquant l'accord inter-annotateur dans le corpus FrSemcor Lucie Barque

16.10.2023 Ambivalence sémantique Alain Polguère

28.08.2023 WSD & RL-fr : une expérience Mathieu Constant

05.07.2023 Polysémie et terminologie Laurence Kister

31.03.2023 séance de lecture partagée Veronika Lux Pogodalla

24.03.2023 séance de lecture partagée Sandrine Ollinger

17.02.2023 séance de lecture partagée Évelyne Jacquey

13.02.2023 Levée d’ambiguïté manuelle (prémisses) Évelyne Jacquey & Sandrine Ollinger

22.11.2022 Enseigner la polysémie pour soutenir l’acquisition du vocabulaire Veronika Lux Pogodalla

20.09.2022 Réunion de lancement

07.11.2026	Méthodes de prédiction automatique de la complexité lexicale	Mathieu Constant
08.07.2026	Présentation livre fonctions lexicales	Alain Polguère
23.04.2026	Formation Zotero	Alexis Coutant
24.03.2026	Bibliographie sous Zotero	Virginie Moulla
18.02.2026	Présentation du GR Stage immersion de professeurs en laboratoire	Sandrine Ollinger
03.03.2026	Présentation des travaux du GR PAL Manuel vs. automatique Pistes de collaboration autour de la difficulté de la tâche d'annotation en sens lexicaux	Benjamin Husson Sandrine Ollinger Aman Sinha
01.03.2026	Début stage « Classification non supervisée de l’inventaire des définitions du TLFi »	Victor (Chenhan) GAO Mathieu Constant Benjamin Husson

16.12.2025	Réunion d'échanges et d'information
14.11.2025	Phraséographie bilingue d'unités pragmatiques du discours. Questions théoriques et méthodologiques.	Anja Smith
01.07.2025	Usage pragmatique des expressions honorifiques coréennes - sugohasieossseubnida et gosaenghasieossseubnida	Younghyun Ha
29.04.2025	Fonctions sémantico-pragmatiques dans le discours spécialisé	Ioana Buhnila
28.04.2025	Enquête ALUMCoCo	Sandrine Ollinger
01.04.2025	Référence et annotation lexicale	Évelyne Jacquey & Laurence Kister
12.02.25	Présentation du GR Stage immersion de professeurs en laboratoire	Sandrine Ollinger
03.02.2025	La prédiction de liens peut-elle enrichir des graphes lexico-sémantiques du français ?	Hee-Soo Choi
14.01.2025	Réunion d'échanges et d'information

27.05.2024	Remarques sur l’enseignement/apprentissage des termes polysémiques	Paolo Frassi
22.03.2024	Pré-campagne d'annotation : Apprendre à regarder ensemble dans la même direction JTTA corpus	Sandrine Ollinger & Évelyne Jacquey
18.03.2024	Réunion de lancement ALUMCoCo
01.02.2024	Référence et chaînes de références	Laurence Kister

21.12.2023	Réunion d'échanges et d'information
13.11.2023	Les difficultés inhérentes à la tâche de classification sémantique : étude statistique des facteurs linguistiques expliquant l'accord inter-annotateur dans le corpus FrSemcor	Lucie Barque
16.10.2023	Ambivalence sémantique	Alain Polguère
28.08.2023	WSD & RL-fr : une expérience	Mathieu Constant
05.07.2023	Polysémie et terminologie	Laurence Kister
31.03.2023	séance de lecture partagée	Veronika Lux Pogodalla
24.03.2023	séance de lecture partagée	Sandrine Ollinger
17.02.2023	séance de lecture partagée	Évelyne Jacquey
13.02.2023	Levée d’ambiguïté manuelle (prémisses)	Évelyne Jacquey & Sandrine Ollinger
22.11.2022	Enseigner la polysémie pour soutenir l’acquisition du vocabulaire	Veronika Lux Pogodalla
20.09.2022	Réunion de lancement