Recherche

Résumé

Formée à la syntaxe de l’oral par le groupe du Gars, j’ai d’abord étudié l’emploi des prépositions/adverbes/conjonctions « après », « avant » et « pour » dans les corpus. Puis ma thèse a porté sur une construction : celle des dépendances à longue distance. Toutes mes recherches sont appuyées sur corpus, oraux et/ou écrits.

Les projets auxquels j’ai participé (voir la page Projet) concernent l’oral (CRFP2, PERCEO), l’écrit (Frantext), ou l’écrit et l’oral (EIIDA, ORFEO). Mes compétences en linguistique informatique ont été sollicitées dans ces projets pour le traitement des données (standardisation et étiquetage morphosyntaxique notamment).

Actuellement, mes sujets de recherche sont :

  1. les « clause linkage » dans les corpus d’EIIDA
  2. les emplois de « genre » dans les corpus d’ORFEO
  3. le rapprochement textuel de chansons dans une optique de recommandation.

 

Thèse : Dépendances à longue distance en français contemporain – Etude sur corpus

These_Berard_Lolita_2012

Composition du jury :

  1. Jean-Marie Pierrel, Professeur, Université de Lorraine, Président
  2. Sylvain Kahane, Professeur, Université Paris Ouest Nanterre La Défense, Rapporteur
  3. Claus Pusch, Professeur, Université de Freiburg (Allemagne), Rapporteur
  4. Catherine Schnedecker, Professeur, Université de Strasbourg, Examinatrice
  5. Jeanne-Marie Debaisieux, Professeur, Université Paris 3 Nouvelle Sorbonne, Directrice
  6. Henri-José Deulofeu, Professeur Emérite, Université de la Méditerranée, Co-directeur

Notre étude porte sur un sous ensemble de séquences, construites en « QU- Construction_Verbale_1 que Construction_Verbale_2 », dans lesquelles on considère traditionnellement qu’il y a une dépendance à longue distance si l’élément QU- dépend du V2 enchâssé. Nous nous sommes limités aux relatives, aux interrogatives et aux clivées, c’est à dire aux structures dans lesquelles la présence d’une forme bien identifiable (pronom QU-) facilite le repérage de son lien syntaxique avec le reste de la construction. La littérature concernant ce phénomène est riche mais peu appuyée sur corpus.

Dans un premier temps, notre étude a confronté les conclusions de la littérature et les attestations relevées dans un corpus de 12M de mots, partagé en 9M d’écrit (corpus CERF) et 3M d’oral (treize corpus). Dans un deuxième temps, nous avons adopté une méthodologie corpus-driven. A partir d’une étude détaillée des propriétés syntaxiques, lexicales et sémantiques des occurrences de dépendance à longue distance relevées dans notre corpus, nous avons montré que la contrainte ne vient pas tant du lexique du verbe pont que de sa construction.

Si le choix du lexique verbal semble dépendre du « genre » du corpus observé, la forme syntaxique du pont apparaît constante : quasiment toutes les occurrences ont un pont constitué uniquement du sujet et du verbe (du type qu’est-ce que vous voulez que j’y fasse). La composition de ces deux éléments SV est également simple dans la majorité des cas : le sujet est pronominal, le verbe est conjugué au présent de l’indicatif, à la voix active, et il n’est pas nié ni modalisé. La construction pont, sans être aussi formulaire que celle décrite en anglais (« WH- do you think S », cf Dąbrowska 2008, Dąbrowska et al. 2009) et en néerlandais (« WH denken P2 dat », cf Verhagen 2006), possède donc une forme particulière.

La forme particulière que la construction adopte dans l’usage pourrait sans doute être interprétée comme une contrainte de processing ou de performance, dans la lignée de Hofmeister & Sag (2010). La petite taille du verbe pont (2-3 mots, 4-5 syllabes) permet de raccourcir la distance topologique entre le complément et son verbe recteur et l’absence de poids syntaxique du verbe pont ne sollicite pas trop la mémoire des interlocuteurs. Mais cette approche revient à partir des structures générales construites théoriquement et à les limiter pour les rendre compatibles avec les faits. Culicover & Jackendoff (2005) proposent de procéder en sens inverse en partant des structures attestées et ne modélisant qu’elles.

Dans le sens de cette démarche, plutôt que de considérer comme la quasi-totalité des travaux que la structure de nos exemples met en œuvre un enchâssement de phrases (ce qui produit une distance hiérarchique entre l’élément antéposé et son recteur V2 enchâssé), nous proposons de considérer les deux constructions verbales comme un constructeur ou gouverneur complexe (une simple concaténation de catégories). Cette analyse efface la distance structurale entre le V2 et son complément antéposé et l’élément antéposé n’est plus un dépendant à distance mais un dépendant local du constructeur complexe. Ce choix est motivé d’une part par la forme de la CV1, qui ne peut jamais se développer comme une « phrase » (pas de compléments ni d’ajouts descriptifs) et d’autre part par le fait qu’à cette forme restreinte particulière est associé un sens lui-même particulier de nature modale : les seuls verbes qui ne sont pas attestés dans nos observations et semblent impossibles en pont sont les verbes décrivant une relation objective entre les faits, comme les relations de causalité (« faire », « éviter », « entraîner »). La construction de dépendance à longue distance en complétive est proche de celle en infinitive, qui met en jeu de nombreux verbes modaux, semi-modaux et factitifs en V1, donc des verbes à valence réduite. La proximité topologique et syntaxique des deux verbes tensés (problème de pronominalisation de V2 par V1) appuie l’hypothèse du constructeur complexe comme construction particulière du français. Nous proposons d’étendre à nos séquences à complétive l’analyse en « chaîne verbale », à la suite de Blanche-Benveniste (non publié) et de « nucleus verbal » (Kahane 2008) :

« Il est possible dans une relative de remplacer le verbe principal de la relative par n’importe quelle chaîne de verbes :

chaineVerbes_Kahane

[…] On peut alors formuler la contrainte sur l’extraction de manière très simple : seul peut être relativisé un dépendant immédiat du verbe principal, sachant que le verbe principal peut être un verbe simple, mais aussi un nucléus verbal » (Kahane, 2008, p. 15 – en ligne).

La modalisation par bulle (Kahane 1997, 2000) est la plus adéquate à notre description. Les autres modèles proposent des insertions de noeuds « phrases » qui provoquent des sur-générations d’énoncés parce qu’ils ne limitent pas la construction à Sujet Verbe et autorisent indéfiniment la récursivité. La modélisation par l’arbre à bulle met en évidence le lien particulier entre les deux verbes.

Références :

  • AMBRIDGE Ben, GOLDBERG Adele (2008) The island status of clausal complements: Evidence in favor of an information structure explanation. Cognitive Linguistics, 19(3), 357–389.
  • BLANCHE-BENVENISTE Claire (Non publié) Un statut de chaîne verbale, Mélanges offerts à G. Lazard.
  • BLANCHE BENVENISTE Claire, WILLEMS Dominique (2009) Verbes’ faibles’ et verbes à valeur épistémique en français parlé: il me semble, il paraît, j’ai l’impression, on dirait, je dirais. Proceedings of the International Congress of Romance Languages and Linguistics.
  • CULICOVER Peter, JACKENDOFF Ray (2005) Simpler Syntax (1re éd.). Oxford University Press, USA.
  • DąBROWKA Ewa (2008) Questions with long-distance dependencies: A usage-based perspective. Cognitive Linguistics, 19(3), 391-425.
  • DąBROWKA Ewa, Rowland Caroline, & Theakston Anna (2009) The acquisition of questions with long-distance dependencies. Cognitive Linguistics, 20(3), 571–597.
  • ERTESCHIK-SHIR Nomi (1973) On the nature of island constraints.(Thesis). Massachusetts Institute of Technology, Cambridge. Consulté à l’adresse http://dspace.mit.edu/handle/1721.1/12991
  • FEATHERSTON Samuel (2005) Bridge verbs and V2 verbs–the same thing in spades? Zeitschrift für Sprachwissenschaft, 23(2), 181–209.
  • GODARD Danièle (1980) Les Relatives parenthétiques du français : la contrainte du syntagme nominal complexe (CNPC) et les « verbes-ponts ». Linx, (2), 35-88.
  • HOFMEISTER Philip, SAG Ivan (2010) Cognitive constraints and island effects. Language, 86(2), 366–415.
  • KAHANE Sylvain (1997) Bubble trees and syntactic representations. In Becker & Krieger (Éd.), Proc. 5th Meeting of the Mathematics of Language (MOL5) (p. 70-76). Saarbrücken: DFKI.
  • KAHANE Sylvain (2000) Extractions dans une grammaire de dépendance lexicalisée à bulles. Traitement Automatique des Langues, 41(1), 187–216.
  • KAHANE Sylvain (2008) Le rôle des structures et représentations dans l’évolution des théories syntaxiques. (G. Lecointre & J. Pain, Éd.) Evolution : méthodologie, concepts, Les cahiers de l’Ecole Doctorale « Connaissance, Langage, Modélisation », Université Paris X, Nanterre. Consulté à l’adresse http://www.kahane.fr/?u_act=download&dfile=DG-Darwin2008.pdf&
  • MøRDRUP Ole (1975) Présuppositions, implications et verbes français. Revue romane, 125–155.
  • ROSS John Robert (1967) Constraints on variables in syntax. (Thesis). Massachusetts Institute of Technology. Consulté à l’adresse http://www.eric.ed.gov/PDFS/ED016965.pdf
  • VERHAGEN Arie (2006) On subjectivity and « long distance Wh-movement ». In A. Athanasiadou, C. Canakis, & B. Cornilie (Éd.), Subjectification: Various Paths to Subjectivity (p. 323-346). Berlin/New York: Mouton de Gruyter.

 

Vulgarisation

Une vidéo de José Deulofeu : « Pourquoi ne parle-t-on pas comme on écrit ? » https://vimeo.com/116970543