L'identification des domaines de connaissance et d'activité
représente une dimention à part entière de la description des langues.
Elle ne se limite pas au vocabulaire spécialisé et entretient une
relation de complémentarité avec l'analyse des classes sémantiques.
Références
« Les champs domaine et sous-domaine
dans les dictionnaires électroniques » (en collaboration avec
P.-A. Buvet), Cahiers de lexicologie, 75, 1999-2,
pp. 173-191. En ligne.
Dans un dictionnaire électronique, toutes les unités lexicales doivent
être codées non seulement du point de vue syntaxique et sémantique,
mais aussi en termes de domaines. Cette information ouvre la voie à
plusieurs applications, telles que l'élimination des ambiguïtés, la
réalisation de glossaires ou l'identification du sujet d'un texte. Pour
ce faire, il est utile de distinguer deux niveaux de description, le
domaine et le sous-domaine. On montrera ici l'intérêt de cette
information pour le traitement automatique des langues, en précisant le
lien entre les deux catégories et la méthode de codage proposée.
« La représentation des verbes dans un dictionnaire
électronique : de la langue générale aux langues
spécialisées », Cahiers de Lexicologie,
81, 2002-2, pp. 51-67. En ligne.
Cet article montre, à propos de l'exemple des verbes, l'importance du
principe de contextualité pour la lexicographie informatique. Un
dictionnaire électronique doit indiquer, pour chaque verbe, les
éléments syntaxiques et sémantiques qui caractérisent le contexte, i.e.
les types de sujets et de compléments qui lui sont associés dans le
cadre de la phrase. En cas de polysémie, il faut prévoir autant de
schémas d'arguments que d'emplois différents : cette disposition permet
une représentation plus fine des propriétés linguistiques (et un
meilleur traitement des traductions dans les dictionnaires
multilingues). Dans un deuxième temps, l'auteur montre que cette
méthode, initialement conçue pour la description de la langue générale,
mérite d'être appliquée aux langues spécialisées. Celles-ci ne se
réduisent pas à des nomenclatures terminologiques, mais constituent de
véritables « langues » faites de verbes et de phrases. La description
linguistique et le traitement informatique des textes techniques
rendent nécessaire la réalisation de dictionnaires d'un type nouveau,
associant étroitement lexique, syntaxe et sémantique.
« Domaines et classes sémantiques », Verbum,
t. XXIX, n° 1-2, Presses universitaires de Nancy, 2007, pp. 11-24. En ligne.
Cette étude porte sur l'articulation entre les « domaines » d'activité
et les « classes » sémantiques. Après une mise au point terminologique
sur les deux termes en présence, une double démarche est proposée. On
commence par établir, à partir de trois exemples (verbes relatifs à la
coiffure, à la politique et aux nombres), que les domaines constituent
des ensembles hétérogènes, analysables en classes sémantiques plus
fines. Dans un deuxième temps, l'analyse montre que le rapport peut
s'inverser : une même classe est susceptible de traverser plusieurs
domaines. Cet entrecroisement des deux catégories fonde leur
complémentarité. Elles sont toutes deux utiles pour la résolution des
ambiguïtés, dans le cadre du traitement automatique des langues.