POUR UNE APPROCHE LINGUISTIQUE DES DOMAINES


L'identification des domaines de connaissance et d'activité représente une dimention à part entière de la description des langues. Elle ne se limite pas au vocabulaire spécialisé et entretient une relation de complémentarité avec l'analyse des classes sémantiques.


Références

« Les champs domaine et sous-domaine dans les dictionnaires électroniques » (en collaboration avec P.-A. Buvet), Cahiers de lexicologie, 75, 1999-2, pp. 173-191. En ligne.


Dans un dictionnaire électronique, toutes les unités lexicales doivent être codées non seulement du point de vue syntaxique et sémantique, mais aussi en termes de domaines. Cette information ouvre la voie à plusieurs applications, telles que l'élimination des ambiguïtés, la réalisation de glossaires ou l'identification du sujet d'un texte. Pour ce faire, il est utile de distinguer deux niveaux de description, le domaine et le sous-domaine. On montrera ici l'intérêt de cette information pour le traitement automatique des langues, en précisant le lien entre les deux catégories et la méthode de codage proposée.

« La représentation des verbes dans un dictionnaire électronique : de la langue générale aux langues spécialisées », Cahiers de Lexicologie, 81, 2002-2, pp. 51-67. En ligne.

Cet article montre, à propos de l'exemple des verbes, l'importance du principe de contextualité pour la lexicographie informatique. Un dictionnaire électronique doit indiquer, pour chaque verbe, les éléments syntaxiques et sémantiques qui caractérisent le contexte, i.e. les types de sujets et de compléments qui lui sont associés dans le cadre de la phrase. En cas de polysémie, il faut prévoir autant de schémas d'arguments que d'emplois différents : cette disposition permet une représentation plus fine des propriétés linguistiques (et un meilleur traitement des traductions dans les dictionnaires multilingues). Dans un deuxième temps, l'auteur montre que cette méthode, initialement conçue pour la description de la langue générale, mérite d'être appliquée aux langues spécialisées. Celles-ci ne se réduisent pas à des nomenclatures terminologiques, mais constituent de véritables « langues » faites de verbes et de phrases. La description linguistique et le traitement informatique des textes techniques rendent nécessaire la réalisation de dictionnaires d'un type nouveau, associant étroitement lexique, syntaxe et sémantique.

« Domaines et classes sémantiques », Verbum, t. XXIX, n° 1-2, Presses universitaires de Nancy, 2007, pp. 11-24. En ligne.

Cette étude porte sur l'articulation entre les « domaines » d'activité et les « classes » sémantiques. Après une mise au point terminologique sur les deux termes en présence, une double démarche est proposée. On commence par établir, à partir de trois exemples (verbes relatifs à la coiffure, à la politique et aux nombres), que les domaines constituent des ensembles hétérogènes, analysables en classes sémantiques plus fines. Dans un deuxième temps, l'analyse montre que le rapport peut s'inverser : une même classe est susceptible de traverser plusieurs domaines. Cet entrecroisement des deux catégories fonde leur complémentarité. Elles sont toutes deux utiles pour la résolution des ambiguïtés, dans le cadre du traitement automatique des langues.


Autres liens :
La langue de la médecine