Séminaire Leila Kosseim

Bonjour à tous,

Vous êtes cordialement invités à participer au sixième séminaire du LATECE de la saison 2016/2017.

Qui? Leila Kosseim, prof au département d’informatique et de génie logiciel de l’Université Concordia

Quand? Mercredi 23 novembre 2016 à 12h45 (12h15 pour la pizza)

Où? PK-4610

Titre Extraction Automatique de marqueurs de discours français à partir de textes parallèles Résumé Les marqueurs de discours (par exemple, « parce que » ou « tel que ») constituent des indices linguistiques très forts pour identifier les relations discursives dans des textes.  C’est pourquoi (tiens… voici un autre marqueur) un dictionnaire de marqueurs de discours est très utile pour de nombreuses applications en traitement automatique de la langue (TAL); cependant peu de langues possèdent une telle ressource.  Dans cette présentation, nous présenterons nos travaux visant à créer automatiquement un tel dictionnaire à partir de textes parallèles.  Notre méthode identifie des marqueurs candidats et les pondère en utilisant le Rapport de Vraisemblance Logarithmique (« log-likelihood ratio »).  Puis, la liste de candidats générée est ensuite filtrée en utilisant diverses méthodes : la première est basée sur l’alignement automatique de mots, la seconde est basée sur des étiquettes grammaticales et la dernière utilise des patrons syntaxiques.  Nous avons évalué notre méthode pour extraire des marqueurs discursifs français à partir de la section français-anglais du corpus parallèle Europarl.  Les résultats montrent que le filtre syntaxique atteint la valeur MAP (“Mean Average Precision”) la plus élevée (0.39) lorsque l’on prend la ressource LEXCONN comme référence. Biographie Leila Kosseim a reçu son doctorat en Traitement Automatique de la Langue Naturelle (TAL) de l’Université de Montréal en 1995.  Récipiendaire d’une bourse postdoctorale CRSNG en milieu industriel, elle a travaillé ensuite chez Druide informatique en analyse sémantique pour le développement du correcteur Antidote.  En 2001, elle devient professeure au département d’informatique et de génie logiciel de l’Université Concordia où elle co-fonde le laboratoire CLaC (Computational Linguistics at Concordia).  Depuis, elle a (co)dirigé 5 étudiants de doctorat et 12 étudiants de maîtrise en TAL.  Ses domaines de recherche incluent l’intelligence artificielle, le résumé automatique et l’analyse automatique de discours. La présentation sera faite en anglais.

SLIDES

Comments are closed.