corpus – Sandrine Ollinger

Stagiaires de Lettres Modernes

13 février 2026 par Sandrine Ollinger·Commentaires fermés

Ce matin, j’ai eu le plaisir de présenter les travaux du GR PAL à trois stagiaires de Lettres Modernes, qui travaillent avec Julie Glikman. Nous avons parlé réseau lexical du français, polysémie et annotation en sens lexicaux. Nous sommes ensuite passés à la pratique et ils ont annoté une centaine de contextes dans lesquels apparaissaient […]

Orthocorpus V4

26 novembre 2025 par Sandrine Ollinger·Commentaires fermés

Nous avons le plaisir de vous annoncer que le corpus OrthoCorpus, dans sa nouvelle version augmentée (V4), est disponible à l’adresse suivante : https://hdl.handle.net/11403/orthocorpus/v4. Il comporte 1253 articles de la revue Rééducation Orthophonique (plus de 6 millions de tokens), parus entre 1997 et 2022, et rédigés par des orthophonistes et d’autres professionnels de la santé […]

Projeter les voisins du RL-fr sur les contextes d’ALUMCoCo

21 octobre 2025 par Sandrine Ollinger·Commentaires fermés

Dans le cadre du projet ALUMCoCo, je cherchais une façon d’exploiter les voisins lexicaux encodés dans le RL-fr pour obtenir une mesure de l’ambiguïté sémantique de chaque contexte. Ce sera finalement une mesure d’entropie normalisée, calculée à partir d’une matrice d’adjacence sémantique. Le détail se trouve décrit ici : mesure_Voisins.pdf

BEL-RL-fr & RL-fr V3.2 pour ALUMCoCo

7 mars 2025 par Sandrine Ollinger·Commentaires fermés

Avec Alain Polguère, nous venons de publier sur Ortolang deux versions conjointes du Réseau Lexical du français (V3.2) et de sa base de citations lexicographiques (V3.2). Elles correspondent à l’état de la base à la date du 27 novembre 2024. Ce sont les données que nous utilisons dans le cadre du projet ALUMCoCo. • Côté […]

JADT 2024

24 juin 2024 par Sandrine Ollinger·Commentaires fermés

Me voici à Bruxelles pour quelques jours, pour assister aux 17es Journées internationales d’Analyse statistique des Données Textuelles. Une semaine qui s’annonce passionnante pour cette conférence dans laquelle se retrouvent non seulement des linguistes, mais de nombreux autres spécialistes de Sciences Humaines et Sociales. J’aurais le plaisir d’y présenter le travail sur la segmentation en […]

BEL-RL-fr & RL-fr prêts pour JADT

19 juin 2024 par Sandrine Ollinger·Commentaires fermés

Avec Alain Polguère, nous venons de publier sur Ortolang deux versions conjointes du Réseau Lexical du français (V3.1) et de sa base de citations lexicographiques (V3.1). Elles correspondent à l’état de la base à la date du 26 avril 2024. Côté BEL-RL-fr, nous disposons désormais d’une segmentation en phrases, réalisée à l’aide de CASFin. Ce […]

JTTA Corpus

22 mars 2024 par Sandrine Ollinger·Commentaires fermés

Aujourd’hui, avec Évelyne Jacquey, nous saisissons l’occasion de la journée thématique « La linguistique de corpus à la croisée de questionnements théoriques, méthodologiques et empiriques », organisée par Hélène Vinckel-Roisin et Yvon Kermonès, pour revenir sur la pré-campagne d’annotation Appollon parcourt le ciel. Nous discuterons du rôle d’une telle pré-campagne pour se mettre d’accord entre expertes sur […]

Mise en ligne CasFIN

20 mars 2024 par Sandrine Ollinger·Commentaires fermés

En janvier 2020, à la suite de tests de segmentation en phrases réalisés par Marine Schmitt, j’ai commencé une collaboration avec Denis Maurel, dans le cadre du projet BEL-RL-fr. Nous avons travaillé à distance, sur le temps que nous arrivions à dégager l’un et l’autre pour avancer. Notre travail a aujourd’hui abouti et vous pouvez […]

Pour la rentrée : BEL-RL-fr et RL-fr dernier cri

28 août 2023 par Sandrine Ollinger·Commentaires fermés

Avec Alain Polguère, nous venons de publier sur Ortolang deux versions conjointes du Réseau Lexical du français (V3) et de sa base de citations lexicographiques (V3). Elles correspondent à l’état de la base à la date du 9 août 2023. Ce sont les données que nous utilisons désormais dans le cadre des expérimentations du GR PAL. Elles […]

INCEpTION : Retour d’expérience

20 avril 2023 par Sandrine Ollinger·Commentaires fermés

Cette après-midi, dans le cadre des STRange Thursdays, je présenterai l’instrument INCEpTION au service STR. Je m’appuierai sur la campagne d’annotation menée avec Évelyne Jacquey dans le cadre du GR PAL pour illustrer différentes étapes : préparation de la campagne, annotation, arbitrage.

Sandrine Ollinger

ATILF - UMR 7118 - CNRS / UL

Étiquette : corpus