Thèse

Analyse morphologique des mots construits sur base de noms de personnalités politiques

 


Directrices de recherche

Fiammetta Namer, Professeur des Universités, Université de Lorraine

Stéphanie Lignon, Maître de conférences, Université de Lorraine


Mots-clés : anthroponyme, morphologie, lexème, sémantique lexicale, morpho­phonologie, contraintes de bonne formation, occasionnalismes.

Résumé

Notre thèse a pour objectif de décrire le comportement morphologique de l’anthroponyme, nom propre (désormais NPr) référant à un être humain, en tant que base de construction morphologique. Pour ce faire, nous proposons une analyse de mots morphologiquement construits sur des Noms propres de Personnalités Politiques françaises, désormais NPP (e.g. François Fillon > fillonophobie). Nous travaillons à partir de données réelles issues de la Toile, produites spontanément par les locuteurs. Nous adoptons une démarche extensive, telle qu’elle a été initiée par les chercheurs de l’ERSS (désormais CLLE-ERSS) et de l’ATILF (cf. Hathout & Tanguy, 2002 ; Namer, 2003 ; Hathout & alii, 2008 ; Lignon & Plénat, 2009 ; entre autres), c’est‑à‑dire que nous analysons une quantité massive de données pour valider ou infirmer nos hypothèses et mettre en lumière des cas qui, jusqu’alors, passaient inaperçus. Ce projet de thèse s’inscrit également dans une collaboration internationale de linguistes de diverses composantes étudiant les noms d’humains : le projet NHUMA (C. Schnedecker & W. Mihatsch dir.).

D’un point de vue morphologique, le NPr a très peu été étudié. Les quelques études consacrées à la construction de mots français à partir de bases NPr et plus particulièrement anthroponymiques (e.g. Dal, 1997 ; Leroy 2005, 2008 ; Leroy & Roger, 2014 ; Lignon & Plénat, 2009 ; Lasserre, 2016) se cantonnent à la description de cas particuliers, c’est‑à‑dire l’étude de quelques mots construits, dans une monographie sur un suffixe, par exemple (e.g. Lignon, 2000, sur l’étude du suffixe ‑ien). Cette absence d’étude spécifique est naturelle si on analyse le NPr comme une entité vide de sens, référant directement à un individu unique (Mill, 1843 ; Kripke, 1972). Or, si un mot nouveau est construit à partir d’une base NPr, cela suppose que sa construction est sémantiquement motivée par le locuteur qui l’a forgé. Ce sens est élaboré à partir du sens de la base. Donc, la base, i.e. le NPP, doit d’une manière ou d’une autre, posséder un contenu sémantique qui contient une interprétation partagée par une communauté linguistique.

Nous travaillons sur des formes attestées et contextualisées. Les mots construits sur NPP se rencontrent souvent dans des écrits spontanés : sur des forums, blogs ou réseaux sociaux (Huguin, 2015). En d’autres termes, nous devons constituer notre propre corpus puisqu’aujourd’hui aucun corpus existant ne nous permet d’accéder à une quantité de données suffisante pour réaliser notre objectif. Notre démarche de constitution de corpus peut se résumer en deux temps : (1) nous avons tout d’abord généré des formes candidates, c’est-à-dire des mots construits sur NPP dont l’existence est hypothétique (Christiane Taubira > taubiraiser, taubiratiser, taubiriser), (2) pour ensuite vérifier leur existence sur la Toile. 128 808 formes candidates ont été générées automatiquement à partir d’une liste de 90 NPP dont les référents sont des femmes ou hommes ayant exercé une fonction politique de premier plan depuis 1981 en France. Nous construisons notre corpus à partir du contenu de la Toile, en exploitant les outils et méthodologies élaborés dans le passé et présentés dans des travaux antérieurs (e.g. Dal & Namer, 2012, 2015 ; Hathout & alii, 2009). La collecte et le post‑traitement des sources composant le corpus sont effectués en collaboration avec le service R&D de Data‑Observer [1]. Ainsi récoltés, ces données et leurs contextes d’emplois, sont triés et annotés dans une base de données lexicales dans laquelle sont organisés les résultats de notre analyse. Chaque entrée de la base comprend les informations formelles, catégorielles et sémantiques sur la relation morphologique unissant un mot construit et le NPP qui en est la base morphologique.

À travers cette thèse, nous cherchons à montrer que la morphologie apporte un éclairage nouveau à la définition linguistique du NPr, notamment au regard de la notion de lexème, unité de base de la morphologie lexématique. Ce travail va apporter des réponses sur le comportement morphologique du NPr, mais également sur le NPr en général (son sens, sa forme) et fournira un large corpus de construits sur base anthroponymique.

[1] Data Observer (www.data‑observer.com) est une startup spécialisée dans la collecte, le traitement et l’analyse des données textuelles issues du Web.

(Bibliographie relative au résumé)

macronade