Activités de Recherche (2)
Activités de Recherche
- Description et analyse linguistique du lexique construit en français : composition néoclassique, noms déverbaux, noms de propriété, verbes composés, concurrence entre dérivés, productivité, créativité morphologique.
- Analyse automatique des lexèmes morphologiquement construits du français : développement de l'analyseur DériF.
- Exploitation des corpus lexicaux de grande taille : développement du robot WaliM, de la base de données lexicales Lstat.
- Modélisation des lexèmes construits : interaction entre morphologie et sémantique lexicale.
- Relations lexicales dans le lexique biomédical : approche multilingue.
Morphologie constructionnelle du français
Les données sur lesquelles portent mes travaux sont extraites de journaux, documents scientifiques, textes de la Toile. L'objectif est double : montrer l'évolution des modes de construction morphologique dans la langue contemporaine, et présenter les motivations et les limites à l'expansion de ces nouveaux patrons.
Composition néoclassique
- données « récalcitrantes » : La collecte, description et analyse des noms et adjectifs du vocabulaire biomédical (e.g. AMYÉLOCÉPHALIE) ont montré que ces constructions dérogent au mécanisme généralement en oeuvre en morphologie (cf. projets UMLF et VumeF).
- verbes composés : Contrairement aux prédictions réitérées dans la littérature, on observe de nombreux verbes composés dans les langues romanes (e.g. HYDROMASSER). L'étude de l'interprétation et des contraintes de formation de ces verbes permet d'argumenter en faveur de leur rétroformation par analogie.
- construction VN (e.g. CASSE-PIEDS) versus NV (e.g. CAVERNICOLE) : Etude comparative de ces composés (sens, domaines d'emploi, statut des constituants, relations prédicatives) de manière à déterminer l'éventuelle unicité du patron construisant les composés à base verbe + nom.
Dictionnaires versus Internet : les noms déverbaux
- la formation des noms en -oir : Apparemment improductive, la règle de formation de noms en -oir(e) est massivement sollicitée dans les occasionnalismes trouvés en ligne. Bien que répondant quasi-exclusivement aux besoins transgressifs propres à la blogosphère (e.g. CHIALOIR), ces créations sont parfaitement conformes aux contraintes vérifiées dans le lexique attesté.
- la concurrence suffixale (-ment, -age, -ion): Une comparaison réalisée avec soin des noms construits à partir de la même base verbale au moyen de suffixes différents (encuvage, encuvement) contredit des hypothèses émises dans la littérature à propos des rôles spécifiques attribués aux suffixes en jeu.
- comment sont construits les noms en -ance/-ence?: Les noms en -Ance sont soit déverbaux (PRÉFÉRENCE) soit désadjectivaux (LATENCE) soit les deux (SOUFFRANCE), soit dénominaux (LIEUTENANCE). L'histoire de ces noms et leur étude en ligne permet d'élaborer la ou les règles de construction de ces noms.
Doublons et compétition sens/forme
- triplets (V, Vion, Vionner) : A l'image de (CONVERSER, CONVERSATION, CONVERSATIONNER), de très nombreux Vion sont entourés de verbes apparemment synonymes. Une étude en corpus fait apparaître les différentes motivations conduisant à l'existence de ces doublons.
- verbes apparemment désadjectivaux en XaRiser (R = l ou r) : Suivant l'exemple de SCOLARISER (« mettre à l'école » et pas « rendre scolaire ») les verbes en XaRiser possèdent des interprétations en décalage avec leur forme : ils s'interprètent comme strictement dénominaux (SCOLARISER / ÉCOLE), strictement désadjectivaux (POPULARISER/POPULAIRE) ou sont ambigus (MUSICALISER / MUSIQUE ou MUSICAL). L'étude conduit à établir le fonctionnement de cette règle de construction, qui s'observe massivement en ligne.
- noms de propriété ethnique : A partir d'une importante collection de noms de propriété ethnique dénominaux (PORTUGALITÉ) ou désadjectivaux (AMÉRICANITÉ), ce travail démontre que le choix de la base (nom propre de lieu ou adjectif) est exclusivement guidé par des raisons phonologiques.
Traitement automatique du lexique morphologiquement construit (DériF)
Analyse morphosémantique des néologismes :
L'analyseur morphologique, DériF a pour caractéristiques principales :
- le calcul systématique de la forme de la base et du sens du construit par rapport à celle-ci,
- la réitération de l'analyse jusqu'à l'obtention d'une forme indécomposable, et suivant les contraintes imposées par les règles morphologiques,
- l'application au lexique construit par suffixation, préfixation, conversion et composition néoclassique,
- le fonctionnement par application de contraintes linguistique, et prise en compte, par conséquent, des néologismes,
- la production systématique de listes de résultats lors de l'analyse de formes ambiguës :
auto-destruction/NOM => [ auto [[ destruct V* ] ion NOM] NOM]
(auto-destruction/NOM, destruction/NOM, destruct/V*)
"destruction qui s'applique (à soi-même - automatiquement)"
[ [ auto [détruire VERBE] VERBE] ion NOM]
(auto-destruction/NOM, auto-détruire/VERBE , détruire/VERBE)
" (Action - résultat de l'action) de auto-détruire"
Regroupement en familles lexicales :
Parmi les extensions de DériF une approche multilingue validée en français et en anglais permet de relier automatiquement entre eux les noms et adjectifs composés savants d'un corpus spécialisé en médecine (synonymie, hyponymie, approximation) :
phlébodynie/NOM (maladie) " douleur (du -- liée au) veine "
phlébodynie/NOM: synonyme de phlébalgie/NOM
phlébodynie/NOM: sous-type de angialgie/NOM
phlébodynie/NOM: voir aussi phlébite/NOM
Prédictions des propriétés sémantiques lexicales :
Réexploitant les contraintes de sélections propres à certaines règles morphologiques, DériF attribue aux lexèmes base et dérivé d'une règle leurs caractéristiques les plus vraisemblables (par exemple : le verbe de base d'un adjectif en -able doit avoir un argument non-agentif). Ces prédictions sont réalisées dans un format compatible avec le modèle de sémantique lexicale du Lexique génératif, préalablement étendu à la description des mots construits :
Trait :gifler/VERBE:[ sous_cat = < (NPagent), @1 NPpatient, (PPloc) > ]
Trait :giflable/ADJ: @2 [ typeA = propriété, exogène = oui, borne_init = non ] ; rel = nom_modifie(@2 , @1)