vendredi 3 décembre 2010

Séance du 7 décembre 2010

Date et heure: mardi 7 décembre à 19h
Lieu: Département Afrique de l'Inalco RDC - 10 rue Riquet 75019 Paris, Métro Riquet

Titre: Changements syntaxiques dans le yorùbá de la presse (1930-2010) : traitement automatique d’un corpus diachronique et analyse des résultats.
Auteur: Nicolas Aubry (LLACAN - INALCO)
D'après la thèse du même titre

Résumé:
Cette thèse présente une étude de certains changements syntaxiques du yorùbá (Nigeria) de la presse, repérés à partir de sources écrites sur une période, relativement courte, de huit décennies. En raison de cette profondeur historique relativement faible – mais qui représente un quasi maximum pour cette langue pour qui souhaite disposer d’un corpus homogène – les changements repérés et analysés sont évidemment légers.
Comme arrière-plan à cette étude, une description des structures de base du yorùbá dans le cadre théorique de la Grammaire Lexicale Fonctionnelle (Lexical Functional Grammar, LFG) est proposée. Elle couvre principalement le syntagme nominal et le syntagme verbal, avec une attention particulière pour les constructions verbales sérielles (CVS), très fréquentes dans cette langue et définies ici – de façon consensuelle – comme des constructions (a) multiverbales, (b) monoclausales et (c) sans marque explicite de subordination ou coordination.
Avec cet arrière-plan, un traitement automatique est effectué, par un étiqueteur morphosyntaxique, d'un corpus diachronique de 400 000 mots constitué de journaux publiés entre les années 1930 et les années 2000, saisi et standardisé manuellement. Les résultats de cet étiquetage servent dans un deuxième temps de données pour repérer et analyser des changements syntaxiques intervenus au cours de cette période. L'accent est mis sur les phénomènes de grammaticalisation et les constructions verbales sérielles.
Le premier chapitre présente le yorùbá dans le cadre théorique de la Grammaire Lexicale Fonctionnelle et décrit l’étiqueteur morphosyntaxique. Ce dernier exploite notamment une propriété du yorùbá précieuse en termes de calculabilité – une relation de quasi implication entre initiale vocalique et catégorie nominale – pour un étiquetage “ robuste ”, basé sur la forme, d’une grande part des substantifs.
Le deuxième chapitre présente la presse yorùbá d’un point de vue historique, décrit le corpus et sa standardisation et se clôt sur une étude succincte du vocabulaire de la presse. Cette dernière s’attarde sur certains champs lexicaux correspondant à des thèmes particulièrement présents dans les journaux, et propose une étude des fréquences respectives des deux termes de trois paires ‘mot yorùbá / emprunt à l’anglais’ en diachronie.
Le troisième chapitre présente les changements syntaxiques découverts. Dans un premier temps, les évolutions de la fréquence des principales catégories morphosyntaxiques, issues de l’étiquetage automatique, sont présentées sous forme graphique et commentées. Dans un second temps, le comportement en diachronie de certains éléments historiquement verbaux (pẹ̀lú, bá), présents dans des constructions verbales sérielles, est étudié avec plus d’attention et une analyse en termes de grammaticalisation en est proposée.

Aucun commentaire:

Enregistrer un commentaire