2021-2022 Depuis 2019 | Encadrement du mémoire de M2 de Paul Valentin portant sur les insultes sur Twitter. Membre du projet EVALANG portant sur l’évaluation du langage oral chez les jeunes enfants. |
Depuis 2018 | Intervention dans le cadre d’un REP+ pour faire des conférences auprès des enseignants sur la sensibilisation des différences entre français parlé et écrit dans un contexte d’enseignement (4 interventions). Mise en place de deux recherches-actions : l’une sur l’enseignement du langage oral en CE2 et l’autre sur la formulation des exercices de mathématiques en primaire. |
2017-2020 | Membre du projet Donnez votre français à la science. Il s’agit de développer une plateforme de collecte de données écrites et orales en ligne. Ce projet a été financé par la DGLFLF. |
2016 | Participation au projet UOH (responsable : G. Dal, Université Lille 3). Enregistrement d’une vidéo abordant la thématique de la grammaire pour des non-spécialistes. |
2014-2017 | Responsable du projet CANET (co-financement Région Lorraine) – Constitution Annotation Normalisation et Exploitation de Transcriptions de français parlé. |
2013-2016 | Responsable des données dans le cadre du projet ANR ORFEO (responsable du projet : Jeanne-Marie Debaisieux) |
Depuis 2012 | Membre du groupe de travail (GT2) de l’IRCOM portant sur l’interopérabilité. Membre du conseil scientifique de l’IRCOM. |
Depuis 2012 | Participation au projet FRACOV – Français Contemporain Vernaculaire – de l’ILF (responsables : P. Larrivée et F. Lefeuvre) |
2011-2012 | Responsable du projet PERCEO : mise à disposition d’un corpus de français parlé annoté en POS et lemmatisé servant d’entraînement pour un étiqueteur automatique. Ce projet comporte également une phase d’annotation et d’entraînement sur des données écrites provenant de type de texte différents. |
2010-2011 | Responsable d’un projet de mutualisation de corpus de français parlé disséminés. |
2009-2010 | Participation au groupe de travail pour la création d’un Frantext 2. Réflexions autour du moteur d’interrogation et de la politique éditoriale. Responsable : Véronique Montémont. |
2008 | Participation au projet Systematic Lexicon Validator (Sylva) au laboratoire LORIA. Responsables : Claire Gardent, Bruno Guillaume, Karën Fort. |
2008-2009 | Participation au projet du CPER TALC Align en collaboration avec le LORIA. Test et spécification du logiciel JTRANS. |
2007-2012 | Membre du projet de l’Agence Nationale de la Recherche (ANR) Corpus Prosodique de Référence en Français Parlé (Rhapsodie). Responsable : Anne Lacheret. |
Depuis 2007 | Constitution, archivage et mise à disposition de corpus oraux au sein de l’ATILF (projet TCOF). |
2007-2008 | Recherches autour des « ajouts après le point » dans le cadre de l’équipe Macrosyntaxe de l’écrit et de l’oral au sein du laboratoire ATILF. |
Depuis 2006 | Participation à l’Encyclopédie Grammaticale du Français (EGF), projet destiné à faire un bilan des savoirs en linguistique française, coordonné par C. Blanche-Benveniste, M.-J. Béguelin, D. Willems et A. Berrendonner (réunion à l’EPHE à Paris le 16 décembre 2006). |
2006-2007 | Membre du projet de l’Agence Nationale de la Recherche (ANR) Prosodie dans la grammaire (Pro-Gram). Responsable : Jean-Marie Marandin. |
Juil. 2005 | Coordinateur pour le corpus de français parlé du projet japonais The 21st Century COE Program Usage-Based Linguistic Informatics |
Responsable du projet : Yuji KAWAGUCHI | |
Université organisatrice : Tokyo University of Foreign Studies | |
Adresse : http://www.coelang.tufs.ac.jp/multilingual_corpus/fr/ | |
2004 | Participation à la campagne d’évaluation EASY (Evaluation des Analyseurs SYntaxiques) du projet Technolangue EVALDA : responsable de l’annotation syntaxique du corpus oral de référence. |
août-02 | Chargé par J. Véronis de la centralisation et de la saisie informatique des corrections apportées au Corpus de Référence du Français Parlé (projet commencé par Cl. Blanche-Benveniste, continué par M. Bilger et A. Valli pour le Ministère de la Culture, Délégation Générale à la Langue Française, reçu par Mme Anne Magnan) – Contrat CNRS. |
juin-02 | Annotation prosodique de corpus pour le projet européen COralRom, projet géré par E. Cresti et M. Moneglia à Florence donnant lieu à la réalisation de corpus oraux dans quatre langues romanes : italien, français, espagnol et portugais + formation des annotatrices-vérificatrices à Turin. |
avr-02 | Fin de l’alignement texte/son du Corpus de Référence du Français Parlé à la demande de J. Véronis. |
Juil-sept 2001 | Transcription et alignement de corpus de français oral informatisés et réalisation de divers outils informatiques (projet Corpus de Référence du Français Parlé) – Contrat CNRS. |