LES MOTS COMPOSÉS


L'étude des mots composés a retenu mon attention de trois points de vue complémentaires :

- réflexion théorique sur le figement ;
- recensement des unités lexicales ;
- problèmes spécifiques aux mots à trait d'union


Problèmes généraux

« Les mots composés », in R. Martin (éd.), Les concepts opératoires de l’INaLF, INaLF, 1995, pp. 15-19. En ligne.


« Essai de typologie des noms composés français », Cahiers de lexicologie, 69, 1996-II, pp. 71-125. En ligne.

La description des noms composés se limite souvent à un petit nombre de classes morphologiques (préposition + nom, verbe + nom, nom + nom, nom + adjectif, etc.). Une analyse plus fine permet de mettre évidence, bien au contraire, l'extrême richesse des formes de composition. Dans cette étude, plus de 700 types sont identifiés, allant des formes les plus simples (par ex. les onomatopées : "du bla-bla") aux structures les plus complexes ("des pommes de terre en robe de chambre", "une lettre recommandée avec accusé de réception"). Ce niveau de précision est indispensable pour tout traitement approprié de la langue.


« Ruptures paradigmatiques et idiomaticité », in P. Blumenthal et S. Mejri (eds), Les séquences figées : entre langue et discours, Zeitschrift für Französische Sprache und Literatur, Beihefte 36, Franz Steiner Verlag, Stuttgart, 2008, pp. 99-116. En ligne.

Cette étude met l’accent sur un des paramètres constitutifs du figement : les « ruptures paradigmatiques ». À partir d’une base de données de large couverture (plus de cent mille unités lexicales de toutes catégories : noms composés, locutions verbales, etc.), plusieurs tests sont mis en œuvre, impliquant différents types de commutation : substitution de synonymes (devenir chèvre / *devenir bique), d’antonymes (avec une analyse plus détaillée des composés de type Adjectif + Nom : un haut fonctionnaire / *un bas fonctionnaire) ou d’éléments d’une même classe sémantique (un temps de chien / *un temps de chat). Ce dernier point permet d’affiner et de généraliser l’analyse. Il faut compter aussi avec les cas de défigement, dont on trouve de nombreux exemples sur le Web (journée portes fermées) et la possibilité de double interprétation (les deux sens de table ronde). Si les irrégularités distributionnelles ne sont pas le seul élément de l’idiomaticité, dans la mesure où bien d’autres paramètres peuvent entrer en jeu, elles y contribuent pour une part significative.


« Variations graphiques des mots composés dans le Petit Larousse et le Petit Robert », Linguisticæ Investigationes, 12:2, John Benjamins B.V., Amsterdam, 1988, pp. 235-280.

L'analyse de deux dictionnaires français usuels — le Petit Larousse et le Petit Robert — souligne l'instabilité graphique des mots composés. Cet article met en évidence de nombreux désaccords entre les deux ouvrages, ainsi qu'un certain nombre de contradictions internes. L'hésitation concerne principalement l'emploi du trait d'union (audio-visuel ou audiovisuel, fille-mère ou fille mère) et les marques du pluriel (un corps de troupe / un corps de troupes, des essuie-glace / des essuie-glaces). Quelle que soit la meilleure manière de surmonter ces contradictions (acceptation des variantes ou normalisation), il est urgent que les dictionnaires fassent preuve de cohérence.


« Flexion des noms et des adjectifs composés : principes de codage », Rapport technique, juin 2010. En ligne.

Cette étude présente dans le détail un système de codage des noms et des adjectifs composés permettant de décrire, à partir de la liste des lemmes, toutes les formes fléchies correspondantes (mise au pluriel et, pour les adjectifs, au féminin). Il prend en compte la diversité des formes (plusieurs centaines de types morphologiques pour les noms composés) et la complexité de certains schémas flexionnels, notamment pour les mots à trait d'union (FRANCS-comtois mais FRANC-comtoises, arrière-GRAND-mères ou arrière-GRANDS-mères). Le système proposé se veut suffisamment flexible pour pouvoir prendre en charge tous les cas de figure.


Les mots à trait d'union


Dictionnaire électronique des mots à trait d'union. Problèmes de lexicographie informatique,
Thèse de doctorat, Université Paris 13, 1993, 2 vol., 351 p. + dictionnaire 376 p. Abstract.


Les mots à trait d'union. Problèmes de lexicographie informatique
, CNRS-INaLF, Didier érudition, coll. « Etudes de sémantique lexicale », Paris, 1994, 351 p.


« Un dictionnaire électronique des mots à trait d'union », Langue française, n° 108, 1995, pp. 76-85. En ligne
.

This study focuses on the problem of the hyphen in French spelling. It is based upon lexical data laid out in the form of an electronic dictionary, organized according to the principle of data bases (records and fields), which means that each entry is coded in explicit terms, both formally (flexion, variants, etc.) and semantically : 17,000 hyphenated words are thus described. This lay-out lends itself to a more precise analysis of spelling. In particular, it brings into relief the correlations between the use of the hyphen and the morphological structure of compound words (over 300 types are represented) ; it appears that the possibilities of normalization and harmonization depend on word patterns. Agglutinated forms are not always to be preferred, and there is no reason for the hyphen to be systematically discarded : the ambivalence of the sign (halfway between union and separation) reflects the intrinsic duality of certain forms of composition.


« Syntaxe du trait d'union : Structures complexes », Linguisticæ Investigationes, 19:1, John Benjamins B.V., Amsterdam, 1995, pp. 153-171. En ligne.

Parmi les différents emplois du trait d'union en français (emplois typographiques, grammaticaux, lexicaux, etc.), il faut prendre en compte les structures complexes qui dépassent le cadre du mot. Trois modèles sont identifiés : 1) la corrélation, fondée sur la particule mi- (mi-sérieux, mi-plaisant) ; 2) la juxtaposition, et plus particulièrement la structure N0 N1-N2 (l'opposition consonne-voyelles, le vol Paris-Londres), qui permet une description typologique fondée sur la nature du terme introducteur (N0) ; 3) la surcomposition (conférence de presse-marathon, ex-homme de gauche), caractérisée par un désaccord entre la structure morphologique et les limites graphiques (*presse-marathon, *ex-homme). Elle peut se combiner avec les deux premiers modèles (mi-salle de billard, mi-cabinet de travail ; l'interaction recherche fondamentale-recherche appliquée). L'analyse de ces structures s'inscrit dans la perspective d’un traitement automatique des formes complexes.


« Flexion des noms à trait d’union », Rapport technique, mai 2010. En ligne.

La mise au pluriel – et parfois au féminin – des noms à trait d'union se caractérise par sa complexité. Cette étude examine les principales difficultés (flexions internes, formes spécifiques, variantes), avant de présenter une analyse détaillée des formes flexionnelles dans les différents types de composés (verbe + nom, nom + nom, etc.).


« Les origines du trait d’union », extrait des Mots à trait d'union. En ligne.


Bases de données

Les noms à trait d'union : base de 12 000 noms, avec indication des pluriels et des variantes. Accès direct

En préparation (nous donnons ici, à titre d'échantillon, le début de la nomenclature pour chaque catégorie) :