Ce matin, j’ai eu le plaisir de présenter les travaux du GR PAL à trois stagiaires de Lettres Modernes, qui travaillent avec Julie Glikman. Nous avons parlé réseau lexical du français, polysémie et annotation en sens lexicaux. Nous sommes ensuite passés à la pratique et ils ont annoté une centaine de contextes dans lesquels apparaissaient […]

Nous avons le plaisir de vous annoncer que le corpus OrthoCorpus, dans sa nouvelle version augmentée (V4), est disponible à l’adresse suivante : https://hdl.handle.net/11403/orthocorpus/v4. Il comporte 1253 articles de la revue Rééducation Orthophonique (plus de 6 millions de tokens), parus entre 1997 et 2022, et rédigés par des orthophonistes et d’autres professionnels de la santé […]

Dans le cadre du projet ALUMCoCo, je cherchais une façon d’exploiter les voisins lexicaux encodés dans le RL-fr pour obtenir une mesure de l’ambiguïté sémantique de chaque contexte. Ce sera finalement une mesure d’entropie normalisée, calculée à partir d’une matrice d’adjacence sémantique. Le détail se trouve décrit ici : mesure_Voisins.pdf

Avec Alain Polguère, nous venons de publier sur Ortolang deux versions conjointes du Réseau Lexical du français (V3.2) et de sa base de citations lexicographiques (V3.2). Elles correspondent à l’état de la base à la date du 27 novembre 2024. Ce sont les données que nous utilisons dans le cadre du projet ALUMCoCo. • Côté […]

Me voici à Bruxelles pour quelques jours, pour assister aux 17es Journées internationales d’Analyse statistique des Données Textuelles. Une semaine qui s’annonce passionnante pour cette conférence dans laquelle se retrouvent non seulement des linguistes, mais de nombreux autres spécialistes de Sciences Humaines et Sociales. J’aurais le plaisir d’y présenter le travail sur la segmentation en […]

Avec Alain Polguère, nous venons de publier sur Ortolang deux versions conjointes du Réseau Lexical du français (V3.1) et de sa base de citations lexicographiques (V3.1). Elles correspondent à l’état de la base à la date du 26 avril 2024. Côté BEL-RL-fr, nous disposons désormais d’une segmentation en phrases, réalisée à l’aide de CASFin. Ce […]

Aujourd’hui, avec Évelyne Jacquey, nous saisissons l’occasion de la journée thématique « La linguistique de corpus à la croisée de questionnements théoriques, méthodologiques et empiriques », organisée par Hélène Vinckel-Roisin et Yvon Kermonès, pour revenir sur la pré-campagne d’annotation Appollon parcourt le ciel. Nous discuterons du rôle d’une telle pré-campagne pour se mettre d’accord entre expertes sur […]

En janvier 2020, à la suite de tests de segmentation en phrases réalisés par Marine Schmitt, j’ai commencé une collaboration avec Denis Maurel, dans le cadre du projet BEL-RL-fr. Nous avons travaillé à distance, sur le temps que nous arrivions à dégager l’un et l’autre pour avancer. Notre travail a aujourd’hui abouti et vous pouvez […]

Avec Alain Polguère, nous venons de publier sur Ortolang deux versions conjointes du Réseau Lexical du français (V3) et de sa base de citations lexicographiques (V3). Elles correspondent à l’état de la base à la date du 9 août 2023. Ce sont les données que nous utilisons désormais dans le cadre des expérimentations du GR PAL. Elles […]

Cette après-midi, dans le cadre des STRange Thursdays, je présenterai l’instrument INCEpTION au service STR. Je m’appuierai sur la campagne d’annotation menée avec Évelyne Jacquey dans le cadre du GR PAL pour illustrer différentes étapes : préparation de la campagne, annotation, arbitrage.