Rôles et responsabilités
Je suis agent de recherches au sein de l'équipe Traitement multilingue de textes (TMT) du Centre de recherche en technologies numériques (TN) du Conseil national de recherches Canada (CNRC).
Recherche et / ou projets en cours
En général, je m'intéresse à la recherche en traitement automatique des langues (TAL) et ses applications concrètes. Plus précisément, ma recherche est axée sur le développement de modèles d'apprentissage automatique pour résoudre des problèmes tels que la catégorisation de textes, l'étiquetage de séquences et la découverte de relations lexico-sémantiques, souvent appliqués à plusieurs langues en même temps. Je m'intéresse également au développement de nouvelles méthodes pour évaluer ces modèles. Enfin, j'aime organiser des groupes de discussion sur les travaux de recherche récents.
Énoncés de recherches / projets
- Catégorisation de textes : Je développe des modèles pour l'identification de la langue d'un texte, l'identification du domaine, et d'autres tâches de catégorisation de textes.
- Étiquetage de séquences : J'ai développé des modèles pour la reconnaissance d'entités nommées et des méthodes pour évaluer ces modèles.
- Découverte d'hypernonymes : Je développe de nouvelles approches pour découvrir des relations d'hyperonymie (générique-spécifique) entre termes.
- Filtrage de corpus parallèles : J'ai contribué au développement de systèmes qui évaluent la similarité sémantique interlinguistique pour détecter des paires de phrases parallèles, afin d'entraîner des systèmes de traduction automatique.
Études
- Doctorat en traduction, Université de Montréal, 2016
- Maîtrise en traduction (spéc. terminologie), Université de Montréal, 2012
- Baccalauréat en traduction, Université de Montréal, 2010
Affiliations
Association for Computational Linguistics (ACL)
Prix
Plusieurs soumissions bien classées à des compétitions sur :
- l'identification de la langue (dans le cadre des campagnes d'évaluation VarDial)
- la reconnaissance d'entités nommées (TAC-KBP 2017)
- la découverte d'hyperonymes (SemEval 2018, tâche 9)
- le filtrage des corpus parallèles (WMT 2019)
Inventions et brevets
- Logiciel populaire ayant gagné une compétition sur la découverte d'hyperonymes
- Logiciel pour l'évaluation des systèmes de reconnaissance d'entités nommées
Principales publications
Une liste complète est disponible sur Google Scholar
Expérience de travail antérieure
- 2018 : Agent de recherches au laboratoire de Recherche appliquée en linguistique informatique (RALI, Université de Montréal)
- 2016-2018 : Chercheur postdoctoral au Centre de recherche informatique de Montréal.
- 2009-2016 : Assistant de recherches à l'Observatoire de linguistique Sens-Texte (Université de Montréal)
Liens supplémentaires
Gabriel Bernier-Colborne sur Google Scholar
Gabriel Bernier-Colborne sur Semantic Scholar
Gabriel Bernier-Colborne (gbcolborne) sur GitHub