TALEP : Traitement Automatique du Langage Ecrit et Parlé
Mots clés
traitement automatique des langues, apprentissage automatique, annotations linguistiques, traitement de données multimodales, analyse syntaxique, réseaux de neurones, expressions polylexicales, corpus
Responsables
Leonor BECERRA, Benoît FAVRE
Membres
Doctorant
abishek.agrawal@lis-lab.fr
Luminy, AMU TPR2 ET GRAND HALL, bureau 05.19
Enseignant/Chercheur
leonor.becerra@lis-lab.fr
Luminy, AMU TPR2 ET GRAND HALL, bureau 434
Enseignant/Chercheur
frederic.bechet@lis-lab.fr
Luminy, AMU TPR2 ET GRAND HALL, bureau 436
Doctorant
ikram.belmadani@lis-lab.fr
Luminy, AMU TPR2 ET GRAND HALL, étage 4ème, bureau 04.19
Doctorant
alice.delbosc@lis-lab.fr
Luminy, AMU TPR2 ET GRAND HALL, étage 4, bureau 4.16
Enseignant/Chercheur
jose.deulofeu@lis-lab.fr
Luminy, AMU TPR2 ET GRAND HALL, bureau 416
Enseignant/Chercheur
benoit.favre@lis-lab.fr
https://pageperso.lis-lab.fr/benoit.favre/
Luminy, AMU TPR2 ET GRAND HALL, étage 4, bureau 428
Enseignant/Chercheur
abdellah.fourtassi@lis-lab.fr
Luminy, AMU TPR2 ET GRAND HALL, bureau 434
Doctorant
dhia-elhak.goumri@lis-lab.fr
Luminy, AMU TPR2 ET GRAND HALL, étage 4, bureau 04.19
Enseignant/Chercheur
alexis.nasr@lis-lab.fr
Luminy, AMU TPR2 ET GRAND HALL, bureau 436
Enseignant/Chercheur
magalie.ochs@lis-lab.fr
04 91 05 60 68
http://magalie.ochs.free.fr/
Luminy, AMU TPR2 ET GRAND HALL, bureau 434
Enseignant/Chercheur
carlos.ramisch@lis-lab.fr
https://pageperso.lis-lab.fr/carlos.ramisch/
Luminy, AMU TPR2 ET GRAND HALL, bureau 428
Enseignant/Chercheur
marie-helene.stefanini@lis-lab.fr
Luminy, AMU TPR2 ET GRAND HALL, bureau 426
Site web
Objectif scientifique
Les travaux de l’équipe portent sur de nombreux aspects du Traitement Automatique des Langues (TAL). Plus précisément, l’équipe:
- Développe des modèles numériques et symboliques pour le TAL
- Implémente ces modèles dans des outils
- Evalue ces outils à l’aide de benchmarks reconnus par la communauté ou de campagnes d’évaluations
- Met en oeuvre ces outils dans des applications développées dans le cadre de projets divers
- Développe des ressources spécifiques lorsque ces dernières sont inexistantes
Les activités de l’équipe TALEP visent à trouver un bon équilibre entre la linguistique et l’informatique en proposant des analyses linguistiques précises des phénomènes rencontrés et de développer des modèles de traitement efficaces. Une des particularités de l’équipe TALEP est de s’intéresser à des productions linguistiques variées. Cette variété concerne la langue (français, anglais, arabe …), le mode de production (oral ou écrit), le niveau (planifié, spontané, normé, déviant …) ou encore le contexte de production (monologue ou dialogue, monomodale ou multimodale). L’équipe crée des outils génériques de TAL, en particulier la suite d’outils multilingue MACAON qui permet de réaliser des traitements linguistique standards et le logiciel MWETOOLKIT, qui extrait automatiquement des séquences de tokens pouvant constituer des expressions polylexicales à partir de corpus. Tous ces logiciels sont distribués sous licence libre. L’équipe TALEP accorde une grande importance aux aspects méthodologiques de l’évaluation des outils de TAL. Ces évaluations peuvent être menées dans des contextes « écologiques », auprès d’utilisateurs finaux ou dans le cadre de campagnes d’évaluation scientifiques, nationales ou internationales. TALEP est l’acronyme de Traitement Automatique du Langage Ecrit et Parlé.