Avec Alain Polguère, nous venons de publier sur Ortolang deux versions conjointes du Réseau Lexical du français (V3) et de sa base de citations lexicographiques (V3).
Elles correspondent à l’état de la base à la date du 9 août 2023. Ce sont les données que nous utilisons désormais dans le cadre des expérimentations du GR PAL.
Elles comportent quelques menus changements structurels, détaillés dans les documentations associées.
• Côté RL-fr, du point de vue des données :
Nombre de vocables [V] : 18 784 (+160)
Nombre d’unités lexicales [UL] : 29 611 (+391)
Taux de polysémie [UL / V] : 1,58 (+0,1)
Nombre de liens de fonctions lexicales [FL] : 64 709 (+2 068)
Nombre de liens de copolysémie [CP] : 9 659 (+246)
Nombre de liens d’inclusion formelle locution → lexème inclus [IF] : 7 944 (+89)
Taux de connectivité lexicale [(FL + CP + IF) / UL] : 2,78 (+0,05)
Nombre de mots-formes : 306 077 (+3 193)
Nombre d’exemples lexicographiques : 31 817 (+647)
• Côté BEL-RL-fr, du point de vue des données :
Nombre de citations [C] : 31 781 (+650)
Nombre de segments textuels annotés en unités lexicales [S] : 52 600 (+1 253)
Nombre moyen de segments par citation [S/C] : 1,7 (σ = 1,06)
Nombre d’unités lexicales [UL] : 27 745
Nombre moyen de citations par unité lexicale [S/UL] : 1,9 (σ = 2,22)