Date et heure: Mercredi 15 novembre 2017 de 19h à 21h
Lieu: INALCO, 65 rue des Grands Moulins - 75013 Paris
Salle 3.04
Étude du flux de dépendances dans les treebanks en dépendance
Chunxiao Yan - université Paris Nanterre, MoDyCo
Je présenterai mon travail de recherche sur des mesures de la complexité syntaxique dans les treebanks annotés en syntaxe de dépendance. Je commencerai tout d’abord par présenter le projet Universal Dependencies (Nivre et al. 2016) qui distribue des treebanks en dépendance de plus de 50 langues. J’aborderai ensuite les mesures de la complexité syntaxique existantes, et leur lien avec la mémoire immédiate qui est supposée être de l’ordre de 7±2 éléments selon l’étude psychologique de Miller (1956). Je présenterai une nouvelle mesure quantitative sur le flux de dépendances étudiée dans Kahane, Yan & Botalla (2017). Le flux de dépendances est l’ensemble des liens de dépendance qui lie un mot à gauche à un mot à droite d’une position donnée dans la phrase. Cette mesure qui évalue le nombre d’enchâssements centrés (center embeddings) nous permet de mettre en évidence les contraintes mémorielles universelles qui pèsent sur la complexité des structures syntaxiques. À la fin je décrirai des perceptives ainsi qu'un projet en cours sur l'application de cette mesure afin de prédire le niveau de complexité de la phrase pour les apprenants du chinois.
Références citées
Miller, George A. "The magical number seven, plus or minus two: some limits on our capacity for processing information." Psychological review 63, no. 2 (1956): 81.
Nivre, Joakim, Marie-Catherine de Marneffe, Filip Ginter, Yoav Goldberg, Jan Hajic, Christopher D. Manning, Ryan T. McDonald et al. "Universal Dependencies v1: A Multilingual Treebank Collection." In LREC. 2016.
Kahane, Sylvain, Chunxiao Yan, and Marie-Amélie Botalla. "What are the limitations on the flux of syntactic dependencies? Evidence from UD treebanks." In Proceedings of the Fourth International Conference on Dependency Linguistics (Depling 2017), pp. 73-82. 2017.