mardi 13 décembre 2011

Séance du 3 janvier 2012

Date et heure: mardi 3 janvier de 19h à 21h
Lieu: Paris 3-Centre Censier (13 rue de Santeuil) salle 21b( rdc).

Titre: De la distinction entre micro et macrosyntaxe : unité illocutoire, unité rectionelle, entassement
Auteurs: Paola Pietrandrea (Roma Tre et CNRS - Lattice), Sylvain Kahane (université Paris-Ouest, CNRS - MoDyCo)

Résumé:
L'annotation syntaxique d'un corpus de français parlé (ANR Rhapsodie) pose le problème de la segmentation des transcriptions en « énoncés ». Le travail pratique de découpage nous a amenés à considérer deux types d’unités — les unités rectionnelles (unités construites autour d’une tête, qui n’est syntaxiquement dépendante d’aucun élément de rang supérieur) et les unités illocutoires (portions de discours comportant un unique acte illocutoire, soit une assertion, soit une question, soit un ordre, soit une exclamation). Ces deux types d’unités obéissent à des principes d’organisation très différents pris en charge respectivement par la micro- et la macrosyntaxe. Ces deux dimensions possèdent une relative indépendance et aucun des deux niveaux n’englobe l’autre. La définition de l’unité rectionnelle a nécessité de prendre en compte la notion d’entassement (le dispositif syntaxique qui définit les listes) qui permet de rattacher des éléments (comme les reformulations, les disfluences, les réponses à une question partielle) qui ne sont pas régis ni microsyntaxiquement, ni macrosyntaxiquement et n’ont pourtant aucune autonomie syntaxique. Nous proposerons une typologie des entassements incluant une description des coordinations non relationnelles et des doubles formulations. Les deux unités d’analyse (unités rectionnelles et unités illocutoires) et les deux dispositifs de reliage – rection et entassement – permettent de décrire de manière simple des phénomènes complexes comme les questions-réponses, l’instanciation, le discours rapporté, la greffe, le parallélisme entre énoncés ou encore les énoncés discontinus.

jeudi 1 décembre 2011

Séance du 6 décembre 2011

Date et heure: mardi 6 décembre de 19h à 21h
Lieu: Paris 3 Centre Censier (13 rue de Santeuil) salle 21b( rdc).


Titre : Segmentation et induction de lexique non-supervisées du mandarin
Auteur : Pierre Magistry
Équipe : Alpage ( Paris 7 / INRIA )


Résumé :
Cette présentation portera principalement sur la question de
l'identification automatique des mots-formes dans de larges corpus
bruts.
Le problème se pose dans de nombreuses langues (sinon toutes) et se
retrouve en traitement automatique des langues (TAL) sous des noms
variés comme segmentation (en "mots", pour les langues n'utilisant pas
de caractère d'espacement) ou le repérage d'expression multi-mots
(MWE, pour les langues où la présence ou non d'un espace peut être
trompeuse)

Mon travail porte essentiellement sur le mandarin, langue pour
laquelle des systèmes de TAL basés sur l'apprentissage automatique à
partir de ressources annotées manuellement sont disponibles et
largement utilisés. Je tâcherai cependant de montrer que l'utilisation
de tels systèmes pose problème dans le cadre de certaines études
linguistiques, par exemple si celle-ci portent sur le lexique et sa
dynamique dans le temps, l'espace, les genres ou les domaines.

Les quantités de données disponibles rendent difficile l'analyse
manuelle en gardant une vision d'ensemble. Je défends donc l'emploi de
méthodes automatiques dites "non-supervisées" qui induisent leurs
résultats à partir de l'analyse de la distribution de l'ensemble des
données brutes.
Je présenterai en particulier une méthode inspirée d'un hypothèse de
[Harris, 55] suivant laquelle les frontières des unités pertinentes
linguistiquement sont marquées par une plus grande incertitude sur ce
qui va suivre ou précède dans la chaîne parlée. Cette hypothèse a été
formalisée et appliquée à la segmentation non-supervisée du mandarin
par [Jin et Tanaka-ishii, 06]. Je présenterai les améliorations et
adaptations de ce modèle que l'on propose dans [Magistry & Sagot,
2011] ainsi que le travail effectué depuis.

Références principales :
Harris, 1955. From phonemes to morphemes.
(http://www.jstor.org/stable/10.2307/411036)
Jin & Tanaka, 2006. Unsupervised segmentation of Chinese text by use
of branching entropy (http://dl.acm.org/citation.cfm?id=1273129)
Magistry & Sagot, 2011. Segmentation et induction de lexique
non-supervisées du mandarin
(http://atoll.inria.fr/~sagot/pub/TALN11zhseg.pdf)

dimanche 26 juin 2011

Séance du 28 juin 2011

Date et heure: mardi 28 juin 2011 à 19h
Lieu: Département Afrique de l'Inalco RDC - 10 rue Riquet 75019 Paris, Métro Riquet

Titre: Esquisse d'une hiérarchie sémantique de noms d'artefacts du wolof
Auteur: Olivier Bondeelle (Université Paris-Ouest; Leiden University)

Résumé
Si un artefact est une production humaine qui a une fonction déterminée, les noms d'artefacts sont potentiellement très nombreux. Pourtant, aucune étude à ma connaissance n'a exploré ce champ sémantique pour le wolof. Cette présentation est l'ébauche d'une exploration de l'organisation hiérarchique de ce champ. La première partie de cet exposé est une typologie sommaire des noms d'artefacts du wolof. Elle est basée sur le degré de prédicativité des noms, et sur la fonction des artefacts dans la situation dénotée. A une extrémité de l'échelle se trouvent des noms qui ne contrôlent qu'un actant et qui dénotent des objets destinés à la sphère personnelle de l'utilisateur (bijoux, vêtements). A l'autre extrémité se trouvent des noms qui contrôlent au moins trois actants et qui dénotent des moyens d'échanges entre les participants de la situation (moyens de transport, monnaie).
A partir de cette typologie, on propose d'attribuer une étiquette sémantique à quelques types de noms. La notion d'étiquette sémantique (es) a été publiée dans Polguère 2003. Elle consiste grosso modo à synthétiser la composante centrale d'une définition de type lexicographique (Mel'cuk et al. 1995) par une unité lexicale ou un syntagme de la langue de définition. Pour les besoins de la présentation, on se limitera à une définition abrégée. Celle-là prend la forme d'une proposition simple qui spécifie le nombre et la réalisation des actants, ainsi que l'utilisation générale de l'artefact.
La seconde partie se penche sur des noms sémantiquement ambivalents dont la caractéristique est que l'on peut leur attribuer plus d'une es comme dans les exemples ci-dessous.

(a) ñi doon tëgg sabar yi daldi taxaw
3pl pred.pass battre un rythme tam-tam pl aussitôt s'arrêter
Les batteurs de tams-tams s'arrêtèrent

(b) Sabar gi door; ñuy fecc, tëgg mi ak tàccu yi xumb
tam-tam sg commencer 3pl.inac danser battement de tambour sg avec applaudissement pl être animé
La séance de tam-tam commença; on dansa, le battement des tam-tams et les claquements de mains étaient animés

(c) dinaa la bàyyi nga dem ca sabar gi nga ma doon tàggu
pred.inac.1sg 2sg laisser 2sg aller loc tam-tam sg 2sg 1sg pred.pass demander la permission
je te laisserai partir au sabar comme tu me l'avais demandé

(d) [...] sabar ga tas, ñépp fàq, ku nekk daw dugg sa kër
tam-tam sg se disperser 3pl faire une fugue chacun courir entrer poss.2sg maison
l'assemblée (du sabar) se disperse, tous fuient, chacun file droit dans sa maison

Références
Mel'cuk et al. 1995. Introduction à la lexicologie explicative et combinatoire. Duculot
Polguère A. 2003. Etiquetage sémantique des lexies dans la base de données DiCo. TAL, vol. 44(2), 2003: 39-68

lundi 6 juin 2011

Séance du 7 juin 2011

Date et heure: mardi 7 juin 2011 à 19h
Lieu: Département Afrique de l'Inalco RDC - 10 rue Riquet 75019 Paris, Métro Riquet

Titre: Le marquage pluriel des SNs avec démonstratif en yorùbá : un cas de variation diachronique?
Auteur: Nicolas Aubry (INALCO - LLACAN)

Résumé:
Nous limitant au cas de SNs comportant le démonstratif yìí (sg.) / wọ̀nyí (pl.) (de très loin le plus fréquent), nous présentons les trois possibilités pour y marquer le pluriel : (1) la présence de la "marque de pluriel" àwọn préposée à la tête nominale, avec la forme "singulier" du démonstratif yìí, (2) la présence de la forme de pluriel du démonstratif wọ̀nyí, sans la "marque de pluriel" àwọn, enfin (3) la présence à la fois de la "marque de pluriel" àwọn et de la forme de pluriel du démonstratif wọ̀nyí.

(1) àwọn ìwé yii
pl livre dem
'ces livres'

(2) ìwé wọ̀nyí
livre dem.pl
'ces livres'

(3) àwọn ìwé wọ̀nyí
pl livre dem.pl
'ces livres'

Ces trois SNs sont toujours décrits comme synonymes dans les travaux sur le yorùbá, ce que nous acceptons. C'est même le point de départ du travail présenté : s'il s'agit de constructions concurrentes, il peut être intéressant de comparer leurs fréquences respectives en diachronie. Moyennant la caractérisation (manuelle) d'environ 4000 occurrences, nous avons relevé les cas pertinents (démonstratif + pluriel) dans un corpus diachronique de presse couvrant huit décennies, puis effectué les calculs nécessaires.
S'il est difficile de dégager une tendance régulière, certaines périodes se distinguent nettement ; on note par exemple une forte augmentation de la construction (1) dans la période la plus récente alors que cette construction, fréquente au début du 20è siècle, avait "chuté" entre-temps.

mardi 26 avril 2011

Séance du 26 avril 2011

Date et heure: mardi 26 avril 2011 à 19h
Lieu: Département Afrique de l'Inalco RDC - 10 rue Riquet 75019 Paris, Métro Riquet

Titre: DE L’OBLICITÉ EN HAOUSSA
Résumé envoyé aux participants

dimanche 27 mars 2011

Séance du mardi 5 avril 2011

Date et heure: mardi 5 avril 2011 à 19h
Lieu: Département Afrique de l'Inalco RDC - 10 rue Riquet 75019 Paris, Métro Riquet

Titre: Statut du pronom CE en ancien français, dans les incises ainsi que dans ses différentes constructions
Auteur: Julie Glikman (Lattice)

Résumé:
Lorsque l’on regarde en diachronie la construction de l’incise de RF de type « je crois », on observe ainsi une évolution dans sa structure interne, depuis credo en latin jusqu’à je crois en FM :
latin credo > AF ce croi > MF-16e ce crois je > FM je crois
Faut-il, du fait de la présence du pronom régime, en conclure qu’il ne s’agit pas du même type d’incises ? Pourtant, il semblerait que cette incise soit bien la même, avec le même fonctionnement externe et les mêmes effets de sens à première vue. S’il s’agit bien de la même construction incise, il faut expliquer l’apparition, puis la disparition, du pronom régime, pour saisir ce qui a vraiment évolué dans la construction.
Pour expliquer ceci, nous faisons l’hypothèse que le changement observé dans la construction de l’incise est d’un autre ordre. Nous postulons que la construction connaît aussi des paramètres de variation liés à l’opposition oral – écrit. Nous postulons également que dans cette construction, le pronom ce n’est pas un pronom de reprise « forte », et ne vient pas pour saturer la valence verbale, mais qu’il sert de « lieur », de marquage d’insertion à l’hôte, davantage nécessaire dans le pôle écrit que dans le pôle oral. Ce ne serait ainsi pas la valence du verbe de l’incise qui évolue, mais la manière, et la nécessité ou non, de marquer l’insertion dans l’hôte, en fonction du type de données. Cette hypothèse permettrait également d’expliquer la différence entre les incises en ce crois et la construction en comme je crois, sémantiquement proches, mais différentes au niveau du marquage de l’intégration à l’hôte.
De la même manière, il semble que le pronom ce doit être analysé comme un pronom de reprise « faible », ne saturant pas nécessairement la valence verbale, comme en atteste l’observation de ses autres emplois, comme par exemple l’emploi comme corrélatif annonçant une complétive qui, elle, vient saturer la valence, ou, de la même manière que les incises de RF, sa présence dans les incises de Discours Rapporté :

(1) Ço sent Rollant que la mort le tresprent, (Roland 2354)
[Ce sent Roland que la mort le presse]

(2) Ço dit li reis que sa guere out finee. (Roland 704)
[ce dit le roi qu’il a fini sa guerre]

(3) Icele tere, ço dit, dun il esteit, (Roland 979)
[cette terre, ce dit, dont il était…]

Ainsi, le pronom ce peut annoncer une que-P sans saturer la valence verbale, sorte de corrélatif. Pour Franzen (Franzen S.R. (1939), Étude sur la syntaxe des pronoms personnels sujets en ancien français, Almqvist & Wiksells Boktryckeri-A.-B.), le ce vient ainsi « résumer » l’hôte, ce qui est effectivement le cas, mais selon nous pas tant pour saturer la valence du RF, mais bien pour indiquer le lien entre les deux propositions, hôte et incise.
Pour confirmer cette intuition, nous nous intéresserons à l’ensemble des constructions dans lesquelles le pronom CE apparaît en ancien français. Nous commencerons par en dresser une typologie. Dans la Chanson de Roland, on les observe en effet :
Avec des verbes de paroles (dire, répondre, demander…), suivi du style direct ou indirect :

(1) Ço dist Rollant : "Cornerai l'olifant (1701)
[Ce] dit Roland : Je sonnerai l’Olifan

(2) Ço dit li reis que sa guere out finee. (704)
[Ce] dit le roi que sa guerre est finie

Avec des verbes d’expérience (savoir, sentir, voir) :
(3) Ço veit Tierris que el vis est ferut (3929)
[Ce] voit Thierry que son visage est blessé

Autres :
(4) Se Deus ço dunet que jo de la repaire, (288)
Si Dieu donne [ça] que je sorte de là …

Nous chercherons ensuite à établir le statut du pronom, entre complément plein, corrélatif vide, marque redondante, élément facultatif ou au contraire obligatoire (certains verbes apparaissant dans Roland uniquement dans ce schéma), et le statut du ‘second complément’, régi ou hors phrase. Nous pourrons enfin nous interroger sur l’évolution de cette construction, entre permanence et changement.

dimanche 6 mars 2011

Journée "Exemplar Semantics" du vendredi 18 mars 2011

Exemplar semantics, a one day workshop
Organizer: René-Joseph Lavie, MoDyCo, Université Paris Ouest Nanterre la Défense
Date: March 18, 2011 (9:00 – 18:00).
Location: Université Paris Ouest Nanterre la Défense , room G614.

Details on this page.
Download the summaries.

Context
Exemplars have been around in psychology for thirty years.
In linguistics, exemplars are promising as an alternative base for theoretical linguistics, understood as that which together seeks to account for linguistic productivity, learnability and linguistic change: exemplars would make up for the limits of abstraction-based theories.
Over the last fifteen years, exemplars have been used mainly in phonology and in morphology, a little in syntax. Today, their use in semantics is just emerging.
Parallel to this, philosophers propose to circumvent the shortages of Fregean descriptivism with notions such as 'object file' or 'mental file'.
Exemplars and mental files both substitute one abstract entity with a set of more concrete ones. This character is shared by a number of approaches that vary however in scope, intent, and in the way they profile the exemplars and subject them to their goals. So a scene is currently building up that is promising, and that is both unitary and diverse.

Purpose and intent
Survey recent advances in linguistics tending to show why exemplars are wanted in semantics and how their proponents configure them.
Identify what is meant by 'exemplar' as far as semantics is concerned: is the concept univocally defined, what the different acceptations are, how they compare, what merits each has.
Assess what stage different approaches have reached: programmatic / partial achievements / identified open issues / directions for progress.


Programme

9-9:30 Bernard Laks (Vice Président délégué à la Recherche , MoDyCo, U. Paris Ouest Nanterre la Défense , France)
Allocution de bienvenue. Les débuts des exemplaires en linguistique.
(Opening address. Early history of exemplars in linguistics.)

9:30-10:30 William Croft (Professor of linguistics, University of New Mexico , Albuquerque , USA )
Exemplar semantics: cross-linguistic and language internal evidence.

10:30-11 Break

11-12 Andrea Sansò (Professore di linguistica, Università di Insubria, Como , Italia)
Exemplar semantics and diachrony, applications and open questions.

12-14 Lunch

14-15 Dominique Legallois (Maître de conférences, Université de Caen, France)
Modélisation de l'interprétation abductive fondée sur des exemplaires.
(Exemplar-based modelling of abductive interpretation.)

15-15:30 Agathe Cormier (Doctorante, MoDyCo, U. Paris Ouest Nanterre la Défense , France)
La signification dans les Recherches Philosophiques de Wittgenstein : une sémantique des occurrences pour rendre compte du savoir-faire linguistique.
(Signification in Wittgenstein's Philosophical Investigations: a semantics of occurrences to account for linguistic know-how.)

15:30-16 Break

16-17 René-Joseph Lavie (Membre associé, MoDyCo, U. Paris Ouest Nanterre la Défense , France)
Backing exemplar-based semantics to exemplar-based syntax.

17-18 General discussion. Assessment, perspectives.

Language
The languages of the meeting are French and English.

vendredi 25 février 2011

Séance du mercredi 16 mars 2011

Date et heure: mercredi 16 mars 2011 à 19h
Lieu: Département Afrique de l'Inalco RDC - 10 rue Riquet 75019 Paris, Métro Riquet

Titre: Nominalizations as sources of impersonal and passive constructions
An under-explored diachronic path
Auteur: Andrea Sansò, Università dell’Insubria – Como

Résumé:
The aim of this paper is to trace the development of impersonal (and passive) constructions out of a source construction that has been only marginally discussed in the literature on the sources of passive and impersonal constructions so far. Such a source construction consists in an event-central clause with an existential/presentational function of the form “there is X” (X = action noun). The pathway from action nouns to passive and impersonal is quite widespread across different language families in the Americas, and is also attested in some South-East Asian languages.
There appear to be well-defined scenarios for the evolution of passive and impersonal constructions out of their sources and/or out of other impersonal and passive constructions (Siewierska 2010). All these scenarios revolve around changes in the coding properties of agents and patients. A number of generalizations (such as, e.g., the behaviour-before-coding principle) can be made concerning such scenarios, although it is always possible to single out some idiosyncratic developments depending on different (language-specific) factors.
Based on the available diachronic data, and on internal reconstruction whenever possible (Givón 1999; Ringe 2003), the stages of this path will be reconstructed on the basis of the different coding properties of patients and agents in the constructions derived from such a source.

References

Givón, T. 1999. Internal reconstruction: As method, as theory. In: S. Gildea (ed.), Reconstructing grammar. Comparative linguistics and grammaticalization, 107-159. Amsterdam: John Benjamins.
Ringe, D. 2003. Internal reconstruction. In: B. D. Joseph, and R. D. Janda (eds.), The handbook of historical linguistics, 244-261. Oxford: Blackwell.
Siewierska, A. 2010. From 3pl to passive: incipient, emergent and established passives. Diachronica 27 (3).

jeudi 17 février 2011

Séance du mardi 01 mars 2011

Date et heure: mardi 01 mars 2011 à 19h
Lieu: Département Afrique de l'Inalco RDC - 10 rue Riquet 75019 Paris, Métro Riquet

Titre: Réflexions sur le morphème tí du yorùbá
Auteur: Michka Sachnine

Résumé:

Il s’agira, lors de cette présentation, de faire un inventaire aussi exhaustif que possible des différents emplois du morphème yorùbá tí “relatif” dont la fonction est plus large que l’introduction de relatives puisque, outre un certain nombre de locutions ‘subordonnantes’ relatives introduisant des circonstancielles, il introduit aussi d’autres types de subordonnées où, a priori, sa fonction de “relatif” s’efface devant celle de conjonction.
La question, légitime, me semble-t-il, peut se poser dans les termes suivants : comme pour les shampoings, « Y a-t-il 2 en 1 », ou devrait-on considérer qu’on a affaire à deux morphèmes différents, même si la remarquable économie dont fait montre le yorùbá dans l’utilisation de ses morphèmes permet d’en douter ? Réponse avec votre aide le 1er mars !

dimanche 16 janvier 2011

Séance du mardi 08 février 2011

Date et heure: mardi 08 février 2011 à 19h
Lieu: Département Afrique de l'Inalco RDC - 10 rue Riquet 75019 Paris, Métro Riquet

Titre: Constructions modales et discours
Auteur: Paola Pietrandrea

Résumé:
Le discours peut être segmenté dans des unités formellement marquées, qui vont souvent au-delà de la « phrase ». Parmi les nombreuses unités identifiées dans la littérature nous trouvons:
les configurations du discours identifiées par les premiers travaux du G.A.R.S. ;
les unités macrosyntaxiques identifiées par les approches macrosyntaxiques du G.A.R.S., de l’école de Fribourg, aussi bien que de l’école de Florence, en Italie;
Ces unités constituent, entre autres choses, des repères pertinents pour l’analyse de l’expression de la modalité dans les structures du discours.
L’adverbe non factuel italien magari (« peut-être, peut-être bien, mais aussi même»), par exemple, présente une importante polysémie de sens modaux qui peut être expliquée formellement en observant la distribution de cet adverbe dans les configurations de discours. L’analyse de la distribution de magari dans de grands corpus de langue écrite et orale, montre que cet adverbe est dans ses usages associé à la configuration syntaxique de la liste. D’un point de vue fonctionnel, cette régularité est à mettre en relation avec le sens non factuel, commun à tous les emplois de magari : le fait de présenter la situation focalisée par magari comme une option à ne pas exclure parmi les autres prouve que celle-ci est encodée comme une option non factuelle. Ce qui est le plus intéressant, c’est que le sens de magari change en fonction de la liste à laquelle il s’associe. En d’autres termes, la signification non factuelle se spécifie en fonction de la spécification formelle de la liste.
L’observation de la distribution macrosyntaxique et discursive des deux adverbes certamente « certainement » et sicuramente « sûrement », d’ailleurs, permet de relativiser leur apparente synonymie. Malgré leur (quasi‑)synonymie, ces deux adverbes apparaissent dans des configurations de discours tout à fait différentes. Certamente est associé avec des configurations qui encodent une polyphonie, tandis que sicuramente est associé avec des configurations qui encodent l’existence d’un paradigme de jugements alternatifs. D’un point de vue fonctionnel, on peut en conclure que certamente sert à marquer comme certain un contenu en accord ou en désaccord avec d’autres voix discursives, tandis que sicuramente sert à marquer comme certain un contenu en opposition avec d’autres jugements qui peuvent être plus faibles.
L’analyse de la distribution discursive des marqueurs modaux permet de raffiner la définition de certaines catégories modales. A ce niveau d’analyse, il peut également devenir clair que certains aspects des formes modales traditionnellement considérés comme des aspects pragmatiques, tels que par exemple leur fonction interactionnelle, ou textuelle, doivent en fait être prises en compte dans la description sémantique des ces formes et de leurs oppositions paradigmatiques.