Aujourd’hui, j’ai animé une journée de formation auprès des étudiants de l’école doctorale SLTC de l’Université de Lorraine, dans le cadre de la formation Collecter et analyser des données en SHS. Nous avons abordé le cas particulier des données langagières et nous sommes attardés sur deux applications : la transcription de données orales et l’utilisation […]

Le modèle des Systèmes Lexicaux rend compte des différents statuts lexicaux des lexies : Statut phraséologique locution forte semi-locution locution faible collocation collocatif de son gouverneur syntaxique collocatif de son sujet collocatif de son COD collocatif de son CObl collocatif de son complément construction cliché linguistique syntagme libre Statut sémantique anthroponyme toponyme ergonyme ergonyme ou pragmonyme […]

Avec Alain Polguère, nous venons de publier sur Ortolang deux versions conjointes du Réseau Lexical du français (V2.1) et de sa base de citations lexicographiques (V2). Elles correspondent à l’état de la base à la date du 31 mars 2021. Ce sont les données que nous utilisons désormais dans le cadre des expérimentations de désambiguïsation […]

Avec Frédérique Brin-Henry, Évelyne Jacquey et Jessika Perignon, nous avons œuvré ces derniers mois pour préparer une version augmentée du corpus OrthoCorpus. Nous avons appliqué des styles dans Word sur l’ensemble des articles de la revue Rééducation Orthophonique de deux années supplémentaires. Frédérique a travaillé sur les métadonnées avec Clémentine Arnicot. Elles ont harmonisé les […]

Grâce à un coup de pouce avisé de l’équipe du projet Textométrie de l’ENS de Lyon, le BEL-RL-fr est désormais exploitable dans la plateforme TXM, en lieu et place de la version non structurée de la base d’exemples du RL-fr que nous y interrogions avant. Ce format sera disponible à tous lors de la prochaine […]