Projets

2021-2022

Depuis 2019

Encadrement du mémoire de M2 de Paul Valentin portant sur les insultes sur Twitter.

Membre du projet EVALANG portant sur l’évaluation du langage oral chez les jeunes enfants.

Depuis 2018Intervention dans le cadre d’un REP+ pour faire des conférences auprès des enseignants sur la sensibilisation des différences entre français parlé et écrit dans un contexte d’enseignement (4 interventions). Mise en place de deux recherches-actions : l’une sur l’enseignement du langage oral en CE2 et l’autre sur la formulation des exercices de mathématiques en primaire.
2017-2020Membre du projet Donnez votre français à la science. Il s’agit de développer une plateforme de collecte de données écrites et orales en ligne. Ce projet a été financé par la DGLFLF.
2016Participation au projet UOH (responsable : G. Dal, Université Lille 3). Enregistrement d’une vidéo abordant la thématique de la grammaire pour des non-spécialistes.
2014-2017Responsable du projet CANET (co-financement Région Lorraine) – Constitution Annotation Normalisation et Exploitation de Transcriptions de français parlé.
2013-2016Responsable des données dans le cadre du projet ANR ORFEO (responsable du projet : Jeanne-Marie Debaisieux)
Depuis 2012Membre du groupe de travail (GT2) de l’IRCOM portant sur l’interopérabilité. Membre du conseil scientifique de l’IRCOM.
Depuis 2012Participation au projet FRACOV – Français Contemporain Vernaculaire – de l’ILF (responsables : P. Larrivée et F. Lefeuvre)
2011-2012Responsable du projet PERCEO : mise à disposition d’un corpus de français parlé annoté en POS et lemmatisé servant d’entraînement pour un étiqueteur automatique. Ce projet comporte également une phase d’annotation et d’entraînement sur des données écrites provenant de type de texte différents.
2010-2011Responsable d’un projet de mutualisation de corpus de français parlé disséminés.
2009-2010Participation au groupe de travail pour la création d’un Frantext 2. Réflexions autour du moteur d’interrogation et de la politique éditoriale. Responsable : Véronique Montémont.
2008Participation au projet Systematic Lexicon Validator (Sylva) au laboratoire LORIA. Responsables : Claire Gardent, Bruno Guillaume, Karën Fort.
2008-2009Participation au projet du CPER TALC Align en collaboration avec le LORIA. Test et spécification du logiciel JTRANS.
2007-2012Membre du projet de l’Agence Nationale de la Recherche (ANR) Corpus Prosodique de Référence en Français Parlé (Rhapsodie). Responsable : Anne Lacheret.
Depuis 2007Constitution, archivage et mise à disposition de corpus oraux au sein de l’ATILF (projet TCOF).
2007-2008Recherches autour des « ajouts après le point » dans le cadre de l’équipe Macrosyntaxe de l’écrit et de l’oral au sein du laboratoire ATILF.
Depuis 2006Participation à l’Encyclopédie Grammaticale du Français (EGF), projet destiné à faire un bilan des savoirs en linguistique française, coordonné par C. Blanche-Benveniste, M.-J. Béguelin, D. Willems et A. Berrendonner (réunion à l’EPHE à Paris le 16 décembre 2006).
2006-2007Membre du projet de l’Agence Nationale de la Recherche (ANR) Prosodie dans la grammaire (Pro-Gram). Responsable : Jean-Marie Marandin.
Juil. 2005Coordinateur pour le corpus de français parlé du projet japonais The 21st Century COE Program Usage-Based Linguistic Informatics
Responsable du projet : Yuji KAWAGUCHI
Université organisatrice : Tokyo University of Foreign Studies
Adresse : http://www.coelang.tufs.ac.jp/multilingual_corpus/fr/
2004Participation à la campagne d’évaluation EASY (Evaluation des Analyseurs SYntaxiques) du projet Technolangue EVALDA : responsable de l’annotation syntaxique du corpus oral de référence.
août-02Chargé par J. Véronis de la centralisation et de la saisie informatique des corrections apportées au Corpus de Référence du Français Parlé (projet commencé par Cl. Blanche-Benveniste, continué par M. Bilger et A. Valli pour le Ministère de la Culture, Délégation Générale à la Langue Française, reçu par Mme Anne Magnan) – Contrat CNRS.
juin-02Annotation prosodique de corpus pour le projet européen COralRom, projet géré par E. Cresti et M. Moneglia à Florence donnant lieu à la réalisation de corpus oraux dans quatre langues romanes : italien, français, espagnol et portugais + formation des annotatrices-vérificatrices à Turin.
avr-02Fin de l’alignement texte/son du Corpus de Référence du Français Parlé à la demande de J. Véronis.
Juil-sept 2001Transcription et alignement de corpus de français oral informatisés et réalisation de divers outils informatiques (projet Corpus de Référence du Français Parlé) – Contrat CNRS.