BEL-RL-fr

Les citations utilisées comme exemples lexicographiques représentent un genre textuel particuliers. En tant que courts extraits choisis pour illustrer des sens et leurs emplois, elles présentent notamment un intérêt pour les travaux en désambiguïsation sémantique automatique (Lux-Pogodalla 2014).

Afin d’en simplifier l’appropriation et l’exploitation, la base d’exemples associée au Réseau lexical du français (RL-fr) est distribuée depuis décembre 2019 sur l’équipex Ortolang en tant que corpus indépendant, sous le nom de BEL-RL-fr.

Tout comme le RL-fr, cette base est enrichie quotidiennement.

Dans l’état courant du réseau, on dénombre 50 578 exemples, associant des unités lexicales à 32 640 citations. Chaque unité lexicale est illustrée par 1 à 63 exemples et chaque citation est utilisée pour illustrer 1 à 12 unités lexicales distinctes.

Ainsi, la citation ci-dessous sert d’exemple lexicographique à chacune des douze unités lexicales en bleu. D’un clic, vous pouvez visualiser leur intégration au réseau et leur description description lexicographique.

Chez nous il est tout juste 20 h et nous revenons du stade nous avons fait un petit football avec quelques copains allemands, suédois et français.
FrWac, février 2008

Les citations sont distribuées dans un format XML conforme aux propositions de la TEI, qui intègre les positions des unités lexicales illustrées. Chaque citation est associée à l’ensemble des métadonnées disponibles (origine, titre de la source, auteur, emplacement, date de publication). Des URI sont utilisés pour établir des liens entre BEL-RL-fr et les mises à disposition du RL-fr préexistantes (visualisation en ligne mise à jour quotidiennement, export téléchargeable).

Ce projet s’inscrit dans le cadre des travaux sur les Systèmes Lexicaux menés sous la responsabilité d’Alain Polguère.

Étapes
?? - ??Sandrine Ollinger
Mathieu Constant
Aman Sinha
CPER LCHN
- expériences de désambiguisation lexicale
juin - août 2020Sandrine Ollinger
Alain Polguère
Camille Kuntz
OLKI
- révision base d'exemples
- validation exemples
- ajout marques d'usage
- révision Mémo
février 2020Sandrine Ollinger- import TXMbillet
sept. - déc. 2019Sandrine Ollinger
Marine Schmitt
Étienne Petitjean
CORLI
CPER LCHN
Distribution V1
- définition format XML-TEI
- implémentation chaîne de traitement
- essais segmentation en phrases
- corrections exemples
- révision CG statuts lexicaux (Alain Polguère)
mars - oct. 2018Sandrine Ollinger
Évelyne Jacquey
Veronika Lux-Pogodalla
Simon Méoni
Alain Polguère
Marie-Sophie Pausé
CoReA2D
CPER LCHN
- annotation d’exemples en sens lexicaux :
• AUBE
• SOLEIL
Bibliographie
S. Ollinger, A. Polguère2020Mémo Systèmes Lexicaux. Exemples lexicographiques Rapport technique, ATILF CNRS, Nancypdf
V. Lux-Pogodalla2014Intégration relationnelle des exemples lexicographiques dans un réseau lexicalActes TALN (Traitement Automatique du Langage Naturel), Marseille, France, Juillet 2014pdf

Statistiques

La V1 du BEL-RL-fr diffusée sur Ortolang comporte 29 892 citations et 49 160 segments textuels annotés en unité lexicale.

répartition des exemples par sourcesrépartition des exemples par dates