Nous avons le plaisir de vous annoncer que le corpus OrthoCorpus, dans sa nouvelle version augmentée (V3), est disponible à l’adresse suivante : https://hdl.handle.net/11403/orthocorpus/v3 Il comporte 1158 articles de la revue Rééducation Orthophonique (plus 5,5 millions de tokens), parus entre 1997 et 2020, et rédigés par des orthophonistes et d’autres professionnels de la santé ou […]

Voici venu le temps de la dernière étape d’une belle collaboration avec Jean-Philippe Corbellini (MSH Val-de-Loire), Gaëlle Deletraz (UMR Passages), Laure Gayraud (Cereq/Centre Émile Durkheim), Élise Tancoigne (Université de Lausanne) et Daniel Valero (UMR ICAR). Depuis le 14 juillet, vous trouverez, sur le site du Bulletin de Méthodologie Sociologique, notre article Un mot pour un […]

Ce jeudi, je présente le corpus BEL-RL-fr et les différents projets qui gravitent autour lors d’une rencontre du service STR. Ça se passe en visio, en raison de la situation sanitaire.

Cette après-midi, j’interviendrai dans le cadre de la demi-journée thématique transversale « Outils informatiques et intelligence artificielle pour les sciences du langage » organisée par Mathieu Constant au sein de l’ATILF. Je présenterai l’état actuel de la ressource et les instruments dont je rêve de disposer pour travailler dessus à l’avenir.

Avec Frédérique Brin-Henry, Évelyne Jacquey et Jessika Perignon, nous avons œuvré ces derniers mois pour préparer une version augmentée du corpus OrthoCorpus. Nous avons appliqué des styles dans Word sur l’ensemble des articles de la revue Rééducation Orthophonique de deux années supplémentaires. Frédérique a travaillé sur les métadonnées avec Clémentine Arnicot. Elles ont harmonisé les […]

Depuis notre Tuto@Mate, avec Jean-Philippe Corbellini (MSH Val-de-Loire), Gaëlle Deletraz (UMR Passages), Laure Gayraud (Cereq/Centre Émile Durkheim), Élise Tancoigne (Université de Genève) et Daniel Valero (UMR ICAR), on peut dire que nous n’avons pas chômé. Après avoir clarifié quelques points, affiné quelques réflexions, pris conseil auprès de Marick Fèvre pour les aspects juridiques, dompté Word […]

La vidéo du Tuto@Mate « La transcription automatique, un rêve enfin accessible ? » est désormais disponible en ligne. Vous pouvez y revoir la présentation et les échanges qui ont suivi.

Ces derniers mois, j’ai participé à un travail collectif de test de plateformes de transcription automatique, en compagnie de Jean-Philippe Corbellini (MSH Val-de-Loire), Gaëlle Deletraz (UMR Passages), Laure Gayraud (Cereq/Centre Emile Durkheim), Élise Tancoigne (Université de Genève) et Daniel Valero (UMR ICAR). Élise Tancoigne présentera la mise en place de ce projet, la démarche adoptée […]

Avec Frédérique Brin-Henry, Jessika Perignon et Évelyne Jacquey, nous venons de déposer sur HAL-SHS un rapport technique qui décrit les principales étapes de réalisation de la version 1.1 du corpus OrthoCorpus.