Eric Joanis

Rôles et responsabilités

Je suis Agent du conseil de recherches au sein de l’équipe de Traitement multilingue de textes (TMT) au sein du Centre de recherche en technologies numériques du CNRC. Depuis mon arrivée au CNRC en juin 2005, j’ai eu l’occasion de combiner mes deux passions, soit la linguistique informatique et le génie logiciel. De manière générale, mes responsabilités consistent à garantir la qualité supérieure des logiciels qui sont produits par l’équipe TMT, ce qui m’amène notamment à développer du code ainsi qu'à tester, déboguer et à optimiser le code écrit par d’autres, tout en le rendant plus robuste et en le documentant. J’aide également les chercheurs de mon équipe à utiliser les infrastructures informatiques et logicielles dont le CNRC dispose. J’ai occupé pendant de nombreuses années le rôle de développeur principal du système de traduction automatique statistique du CNRC, Portage. Plus récemment, j’ai travaillé sur le projet portant sur les technologies pour les langues autochtones (TLA) du CNRC.

Recherche et / ou projets en cours

Les travaux liés au projet sur les TLA ont débuté en 2017. Dans le cadre de ce projet, j’ai travaillé à la publication du corpus parallèle inuktitut – anglais du Hansard du Nunavut 3.0, qui est devenu une ressource essentielle pour les chercheurs en traduction automatique (TA) entre l’inuktitut et l’anglais du monde entier. Il constituait, par exemple, un élément clé de l’évaluation des systèmes de TA pour cette paire de langues lors de la Conférence de 2020 sur la traduction automatique (Findings of the 2020 Conference on Machine Translation (WMT20) - ACL Anthology). Je dirige actuellement le sous-projet du Studio de lecture accompagnée qui a été lancé dans le cadre du projet sur les TLA. Ce sous-projet, mené en collaboration avec l’Université Carleton et M. David Huggins-Daines, permet aux communautés linguistiques de publier leurs propres histoires interactives dont l’audio et le texte sont alignés. Il s’agit d’un système d’alignement forcé de bout en bout de l’audio et du texte et d’une composante Web qui permet de visualiser l’alignement. Les responsables du sous-projet ont travaillé avec des éducateurs qui représentent plus de 20 communautés linguistiques; nous recevons constamment de nouvelles demandes d’éducateurs qui souhaiteraient avoir accès à des lectures accompagnées dans leur propre langue. Pour obtenir de plus amples détails, consultez le site Studio de lecture accompagnée : une application pour les livres audio et les vidéos dans les langues autochtones – Conseil national de recherches Canada

Énoncés de recherches / projets

La traduction automatique, le calcul de haute performance, l’optimisation et la parallélisation des logiciels, et le calcul avec de très grands ensembles de corpus, de modèles et de structures de données font partie des intérêts qui m’animent à long terme. Toutefois, les travaux que je mène actuellement portent sur le développement logiciel de technologies qui soutiennent les enseignants de langues et les militants dans les communautés autochtones du Canada. Alors que je souhaitais déjà appliquer mon expertise en linguistique informatique aux langues autochtones, l’excellent cours « Indigenous Canada » offert par l'Université de l'Alberta via Coursera, que j’ai suivi en 2020-2021, a renforcé ma motivation à travailler dans ce domaine fascinant et socialement utile.

Études

  • Maîtrise ès sciences en linguistique informatique, Université de Toronto, 2022
  • Baccalauréat ès mathématiques en informatique, Université de Waterloo, 1996

Affiliations

Association for Computational Linguistics

Prix

Liste des prix dont je suis le plus fier : 

  • 2021 : Prix de reconnaissance pour réalisations en matière de propriété intellectuelle (PRPI) du CNRC pour les contributions percutantes en matière de logiciel libre qui ont été apportées par l’équipe du projet TLA. Bien qu’il s’agisse d’un prix d’équipe, ce fut extraordinaire d’avoir la chance de participer à de tels travaux sur les technologies pour les langues autochtones qui sont socialement utiles. 
  • 2009 : Prix des réalisations exceptionnelles, ITI-CNRC – Prix général pour l’équipe de projet Portage
  • 2007 : Prix du directeur ITI-CNRC – Transfert de technologie
  • 2007 : Prix des réalisations exceptionnelles, ITI-CNRC – Prix des inventeurs et des innovateurs
  • 1998 : Computer Science Graduate Entrance Award de l’Université de Toronto
  • 1992–1996 : Liste d’honneur du doyen de l’Université de Waterloo et Liste d’honneur du doyen des étudiants finissants
  • 1992 : Premier au Québec dans le cadre de l’American Mathematics Competition.

Principales publications

Technologies pour les langues autochtones 

Système de traduction automatique statistique du CNRC, Portage 

Sémantique lexicale statistique 

Expérience de travail antérieure

En 1996, après avoir terminé mon baccalauréat en informatique, je me suis joint à une petite entreprise appelée Télévitesse, où j’ai eu la chance de travailler sur la catégorisation et la division automatiques de nouvelles télévisées, à l’aide du sous-titrage codé pour malentendants. À la suite de l’obtention de ma maîtrise en linguistique informatique en 2002, j’ai travaillé à titre d’assistant à la recherche pendant un an à l’Université de Toronto, et deux ans à l’Université de Genève. À ces deux endroits, j’ai travaillé dans le domaine de la sémantique lexicale statistique, soit sur la classification et la désambiguïsation d’occurrences de verbes.

En dehors du travail, je fais du bénévolat depuis 2016 en tant qu'animateur auprès de la meute de louveteaux de 1st Aylmer Scouts.

Eric Joanis

Eric Joanis

Agent(e) du conseil de recherche, Sciences et technologie
Technologies numériques
1200, chemin de Montréal
Ottawa, Ontario K1A 0R6
Langue préférée : français
Autre(s) : français, anglais, allemand, espagnol
Téléphone : 343-990-6633

Expertise

Technologie de l'information, Intelligence artificielle, Traitement du langage naturel, Programmation d'ordinateur, Informatique