Tél. : +33 (0)1 49 40 68 35
Fax : +33 (0)1 49 40 68 48
Maître de conférences
Junior 2017
Université Paris 8 Vincennes - Saint-Denis
Sciences Humaines et Humanités
Linguistique de corpus
► Linguistique de corpus
► Sémantique distributionnelle, apprentissage profond et réseaux neuronaux
► Expressions pluri-lexicales
Selon l'hypothèse distributionnelle, les mots qui apparaissent dans des contextes similaires sont sémantiquement proches. Les Modèles de Sémantique Distributionnelle sont des réalisations computationnelles de cette hypothèse. Le sens d'un mot est déduit de la distribution de ses voisins et vectorisé. Les modèles fondés sur les vecteurs se concentrent sur les mots isolés au détriment des expressions pluri-lexicales. Pourtant très fréquentes, ces expressions sont difficiles à détecter et à interpréter par la machine. Dans mon projet, je m'appuie sur l'apprentissage profond et les réseaux neuronaux pour détecter et interpréter les expressions pluri-lexicales à partir de corpus. Des progrès importants sont attendus en lexicographie, protocoles de requête en corpus et en traduction automatique.