mardi 22 septembre 2009

Session 1: lundi 12 octobre présentée par Sylvain

Titre: Typologie des systèmes pronominaux et des catégories de la personne
Auteur: Sylvain Kahane (Modyco)
Résumé:
Presque tous les systèmes pronominaux (pronoms indépendants ou indices pronominaux dans la flexion verbale) réfèrent aux pronoms en utilisant la terminologie héritée de a tradition indo-européenne, où les trois personnes 1, 2, 3 réfèrent à 'moi', 'toi' et 'autre personne', qui combinées avec les valeurs du nombre, singulier et pluriel, donnent 6 valeurs. Même quand le système a plus de 6 valeurs la terminologie est maintenue et adaptée, notamment en distinguant des pronoms de 1ère personne inclusif et exclusif. Nous ferons une revue des systèmes pronominaux possibles et pour lesquels nous avons une attestation. Nous montrerons que la catégorie à 3 personnes n'est pas nécessairement universelle et que le trait inclusif-exclusif ne devrait pas nécessairement être utilisé, même dans les systèmes opérant une distinction entre ce qui est traditionnellement appelé les pronoms de 1ère personne inclusif-exclusif. Nous donnerons des exemples de différentes catégories de personnes attestées dans les langues du monde, notamment l'exemple assez classique de l'algonquin et celui peu connu du totonaque.

ESSLLI'09 à Bordeaux

Bonjour à tous. En tant que ma première participation "officielle" à ce blog, je voudrais partager avec vous mon expérience de ESSLLI'09 (European Summer School in Logic, Language and Information) qui a eu lieu cet été à Bordeaux.

Je le conseille vivement à tous ...après deux semaines dans une ambiance internationale, conviviale et très sympathique (autour de 400 participants du monde entier), avec des cours de 9h00 à 17h30, des "coffee-breaks" et des soirées pour stimuler les échanges, on ressort forcément imbibé (ou au moins trempé) de tout ce qui se passe actuellement entre la linguistique, la logique et l'informatique. Le public, en général des doctorants mais aussi des chercheurs de tout âge, est très large et va des linguistes d'une fibre plutôt poétique jusqu'à des gens qui parsent de l'ADN.

On peut voir quelques photos ici.

Les cours ont été divisés en trois blocs (pas de tout orthodoxes) :
  • Language and Logic - destiné plutôt aux linguistes formels et théoriques
  • Language and Computation - destiné plutôt aux TAListes
  • Logic and Computation - destiné plutôt aux logiciens et les théoriciens de l'informatique
Chaque cours (en anglais évidemment) durait une semaine (1h30 par jour), chaque participant suivait donc 8 cours différents sur toute la durée de l'école. Dans un créneau horaire, il y avait toujours 5 ou 6 cours en même temps, donc forcément, il fallait faire des choix parfois douloureux (le programme entier est ici). En plus, le mardi et le jeudi, il y avait une "evening lecture" donnée par un chercheur auréolé d'un prestige international.

Personnellement, j'ai pris la plupart de mes cours dans la section Language and Computation. J'ai assisté seulement à un cours dans le bloc Language and Logic... le bloc Logic and Computation, je dois l'avouer, m'a fait plutôt peur ;)

En espérant que cela pourrait être intéressant pour vous (pour des recherches des concepts théoriques, des outils, des questions de biblio, etc...), je vous mets ici une liste des cours auxquels j'ai assisté. J'ajoute les liens vers leurs annotations et les matériaux utilisés en classe (notes, slides), accompagnés de quelques observations :

Shravan Vasishth : The foundations of statistics : A simulation based approach
Annotation | Notes

Un très bon cours destiné aux linguistes qui ne sont pas mathématiciens mais qui veulent maîtriser la statistique pour l'évaluation de leurs données expérimentales. De très bon slides et un livre entier sur le sujet disponible (gratuitement) sur le site de Shravan. En plus, on apprend le langage R au passage.


Vito Pirelli : Psycho-computational issues in Morphology Learning and Processing
Annotation | Notes

Les slides sont très bien faits, bien chargés avec des références récentes sur la morphologie sous les aspects psycholinguistiques.


Detmar Meurers : Intelligent Computer-Assisted Language Learning
Annotation | Notes

C'était ce cours-là, qui m'a fait venir à Bordeaux et je n'étais pas déçu! Un état de l'art du domaine avec des perspectives pour le traitement de la sémantique dans les productions libres des apprenants.


Roger Levy : Computational Psycholinguistics
Annotation | Notes

Un cours sur les PCFG (Grammaires hors-contexte probabilistes)... Si vous voulez savoir comment les locuteurs désambiguïsent dans leurs cerveaux les fameuses "garden-path sentences" (par exemple The old man the boat), je vous invite à le regarder.


Daniel Hole & Malte Zimmermann : Focus, Focus Interpretation and Focus Sensitivity
Annotation | Notes

Le titre dit tout. C'était très bien... mais quand même, faire un cours sur focus sans parler des Pragois... ;-)


Miriam Butt and Heike Zinsmeister : Case, scrambling and default word order
Annotation | Notes

Un cours sur l'ordre des mots, le cas et la structure informationnelle illustré sur l'allemand et le urdu par des études de corpus et des expériences psycholinguistiques. J'ai appris l'existence d'un livre de Miriam Butt (spécialiste en LFG) sur le cas (2006. Theories of Case. Textbook. Cambridge University Press.) qui a l'air très très bien.


Alessandro Lenci and Stefan Evert : Distributional Semantic Models - Theory and Empirical Results
Annotation | Notes

Comment calculer le sens des mots juste en regardant leur voisins dans un corpus. Un cours assez chargé au niveau mathématiques mais très clair avec des matériaux bien fait
.

Michael Zock
: The mental lexicon, blueprint of the dictionaries of tomorrow: linguistic, computational and psychological aspects of a highly valuable resource
Annotation

Un cours intéressant sur les possibilités de la psycholinguistique et du TAL dans la constitution des dictionnaires.


... et voici trois cours auxquels je n'ai pas assisté mais que je regrettais beaucoup :

Brian Murphy : Grammaticality Judgements as Linguistic Evidence
Annotation | Notes

J'aime bien le côté "tribunal" de l'intitulé de ce cours ;-)

Gerald Penn & Sheelagh Carpendale : Linguistic Information Visualisation
Annotation | Notes

C'est le sujet qui me trouble beaucoup en ce moment... Un des auteurs donne un cours intitulé Computer Sciences and The Arts ...


Ulrich Schäefer : Standard XML query languages for natural language processing
Annotation | Notes

Les slides pour ce cours sont très pratiques pour les linguistes qui veulent s'initier à XML.

Voilà. Si vous avez des questions, n'hésitez pas à m'en parler, je tâcherais de vous répondre.

Ceux qui seraient séduits par ce genre de vacances studieuses, pensez à demander à temps une bourse pour aller à
ESSLLI'10 (il sera à Copenhague) ;-)

Bien à vous, Ivan

lundi 21 septembre 2009

Avant de commençer...


... les vacances sont finis, petits chenapans! Voici quelques instructions pour utiliser ce blog :


CONNEXION

(1) J'ai envoyé à vous tous (les adresses mail que j'ai trouvées dans la liste d'Olivier) une invitation à participer à ce blog en tant qu'auteur.

(2) En cliquant sur le lien dans le message reçu, vous allez vous retrouver sur une page où vous allez pouvoir confirmer cette invitation et être inscrits comme un des auteurs de ce blog.

(3) Si vous avez un compte chez Google (c'est à dire que vous utilisez déjà Gmail ou Picassa ou Blogger, etc.) vous pouvez entrer directement, sinon il vous faut créer ce compte avant de confirmer l'invitation.

La création du compte Google se fait sur la même page, c'est gratuit et ça prend quelques instants. Pour activer votre nouveau compte, un mail vous est envoyé sur l'adresse que vous avez saisie. Vous cliquez sur le lien dans le mail pour activer le compte.


(4) Une fois connectés sur le blog, vous vous retrouvez sur votre "Tableau de bord" où vous pouvez :
  • Afficher le blog et lire les messages, éventuellement faire des commentaires
  • Écrire un nouveau message qui sera publié sur le blog
  • Avoir une vue succincte de tous les messages en cliquant sur "Modifier les messages"
  • Modifier votre profil (le nom affiché, la photo, des informations sur vous... c'est facultatif)
Pour se connecter la prochaine fois, allez sur le blog (http://informels.blogspot.com) et cliquez en haut à droite sur Connexion. Pour partir, vous pouvez cliquer sur Déconnexion.

PUBLICATION

(5) En ce qui concerne la publication, vous avez le droit :
  • d'écrire un nouveau message
  • de modifier les messages dont vous êtes auteur
  • de supprimer les messages dont vous êtes auteur
  • de commenter librement les messages des autres
(6) La rédaction se fait à l'aide d'un éditeur texte basique intégré sur le site. Chaque message a son titre et son corps. Le message peut être sauvegardé en tant que brouillon ou publié directement. Vous pouvez modifier votre message déjà publié à n'importe quel moment, soit directement sur le blog en cliquant sur le petit crayon en bas à droite de votre message ou à partir de votre "Tableau de bord" en cliquant sur "Modifier les messages".

Si vous voulez écrire un texte plus long que quelques phrases, je vous déconseille vivement de faire votre rédaction directement dans la fenêtre sur le blog... Le risque de perdre son travail à cause d'une mauvaise manipulation est trop important.

(7) Les messages peuvent contenir des caractères "exotiques", des images et une mise en page basique (alignement, paragraphes, listes ; gras, italique, etc.) mais pas des éléments trop compliqués comme des tableaux, des schémas, des arbres syntaxiques, des structures de traits, etc. Donc pour publier des hand-out ou des exempliers pour vos présentations qui contiennent ces éléments, il vaudrait mieux de les attacher à votre message comme une pièce jointe.

(8) Si vous voulez publier une pièce jointe et vous n'avez pas de lien vers cette pièce (l'adresse http de votre fichier accessible quelque part sur internet), vous pouvez me l'envoyer (smilauer@cetlef.fr). Je le mettrai sur mon serveur et je vous enverrai le lien.

TITRE DU MESSAGE

(9) Je vous propose cette "politique" de publication : chacun a le droit de publier un message sur ce qu'il veut tant que cela touche nos préoccupations communes et que cela ne peut pas être ajouté comme commentaire à un message déjà existant.

Pour les messages concernant les exposés, un titre unique serait bien. Je vous propose de mettre le format suivant :

Session XX : "Intitulé de l'exposé" par Nom


Par exemple Session 18 : "Palatalisation des vélaires après 5 Affligens" par Ivan

Et c'est tout ;) Bloguement votre
Ivan.