Projets – Christophe Benzitoun

2021-2022 Depuis 2019	Encadrement du mémoire de M2 de Paul Valentin portant sur les insultes sur Twitter. Membre du projet EVALANG portant sur l’évaluation du langage oral chez les jeunes enfants.
Depuis 2018	Intervention dans le cadre d’un REP+ pour faire des conférences auprès des enseignants sur la sensibilisation des différences entre français parlé et écrit dans un contexte d’enseignement (4 interventions). Mise en place de deux recherches-actions : l’une sur l’enseignement du langage oral en CE2 et l’autre sur la formulation des exercices de mathématiques en primaire.
2017-2020	Membre du projet Donnez votre français à la science. Il s’agit de développer une plateforme de collecte de données écrites et orales en ligne. Ce projet a été financé par la DGLFLF.

2016	Participation au projet UOH (responsable : G. Dal, Université Lille 3). Enregistrement d’une vidéo abordant la thématique de la grammaire pour des non-spécialistes.
2014-2017	Responsable du projet CANET (co-financement Région Lorraine) – Constitution Annotation Normalisation et Exploitation de Transcriptions de français parlé.
2013-2016	Responsable des données dans le cadre du projet ANR ORFEO (responsable du projet : Jeanne-Marie Debaisieux)
Depuis 2012	Membre du groupe de travail (GT2) de l’IRCOM portant sur l’interopérabilité. Membre du conseil scientifique de l’IRCOM.
Depuis 2012	Participation au projet FRACOV – Français Contemporain Vernaculaire – de l’ILF (responsables : P. Larrivée et F. Lefeuvre)
2011-2012	Responsable du projet PERCEO : mise à disposition d’un corpus de français parlé annoté en POS et lemmatisé servant d’entraînement pour un étiqueteur automatique. Ce projet comporte également une phase d’annotation et d’entraînement sur des données écrites provenant de type de texte différents.
2010-2011	Responsable d’un projet de mutualisation de corpus de français parlé disséminés.
2009-2010	Participation au groupe de travail pour la création d’un Frantext 2. Réflexions autour du moteur d’interrogation et de la politique éditoriale. Responsable : Véronique Montémont.
2008	Participation au projet Systematic Lexicon Validator (Sylva) au laboratoire LORIA. Responsables : Claire Gardent, Bruno Guillaume, Karën Fort.
2008-2009	Participation au projet du CPER TALC Align en collaboration avec le LORIA. Test et spécification du logiciel JTRANS.
2007-2012	Membre du projet de l’Agence Nationale de la Recherche (ANR) Corpus Prosodique de Référence en Français Parlé (Rhapsodie). Responsable : Anne Lacheret.
Depuis 2007	Constitution, archivage et mise à disposition de corpus oraux au sein de l’ATILF (projet TCOF).
2007-2008	Recherches autour des « ajouts après le point » dans le cadre de l’équipe Macrosyntaxe de l’écrit et de l’oral au sein du laboratoire ATILF.
Depuis 2006	Participation à l’Encyclopédie Grammaticale du Français (EGF), projet destiné à faire un bilan des savoirs en linguistique française, coordonné par C. Blanche-Benveniste, M.-J. Béguelin, D. Willems et A. Berrendonner (réunion à l’EPHE à Paris le 16 décembre 2006).
2006-2007	Membre du projet de l’Agence Nationale de la Recherche (ANR) Prosodie dans la grammaire (Pro-Gram). Responsable : Jean-Marie Marandin.
Juil. 2005	Coordinateur pour le corpus de français parlé du projet japonais The 21st Century COE Program Usage-Based Linguistic Informatics
	Responsable du projet : Yuji KAWAGUCHI
	Université organisatrice : Tokyo University of Foreign Studies
	Adresse : http://www.coelang.tufs.ac.jp/multilingual_corpus/fr/
2004	Participation à la campagne d’évaluation EASY (Evaluation des Analyseurs SYntaxiques) du projet Technolangue EVALDA : responsable de l’annotation syntaxique du corpus oral de référence.
août-02	Chargé par J. Véronis de la centralisation et de la saisie informatique des corrections apportées au Corpus de Référence du Français Parlé (projet commencé par Cl. Blanche-Benveniste, continué par M. Bilger et A. Valli pour le Ministère de la Culture, Délégation Générale à la Langue Française, reçu par Mme Anne Magnan) – Contrat CNRS.
juin-02	Annotation prosodique de corpus pour le projet européen COralRom, projet géré par E. Cresti et M. Moneglia à Florence donnant lieu à la réalisation de corpus oraux dans quatre langues romanes : italien, français, espagnol et portugais + formation des annotatrices-vérificatrices à Turin.
avr-02	Fin de l’alignement texte/son du Corpus de Référence du Français Parlé à la demande de J. Véronis.
Juil-sept 2001	Transcription et alignement de corpus de français oral informatisés et réalisation de divers outils informatiques (projet Corpus de Référence du Français Parlé) – Contrat CNRS.