Rôles et responsabilités
J’occupe le poste de conseiller technique, Développement d’applications (CS3), au Centre de recherche en technologies numériques du Conseil national de recherches du Canada (CNRC), au sein de l’équipe de traitement de texte multilingue. L’informatique me passionne et j’ai une vaste expérience de la résolution de divers problèmes de logiciels et de systèmes de technologie de l’information. J’aime particulièrement travailler avec des systèmes de calcul de haute performance (CHP), comme les grappes de calcul Linux avancées.
Cependant, contrairement à certains informaticiens, j’aime la compagnie d’autrui. Mes collègues ont fait l’éloge de mes capacités de communication et de mon engagement envers le travail d’équipe. Mon rôle est de soutenir ces collègues : je suis maintenant la personne à contacter lorsqu’ils ont des problèmes informatiques difficiles ou des bogues apparemment inexplicables. Je crée de nouveaux systèmes pour l’équipe, qui sont souvent basés sur l’apprentissage automatique et formés sur de grandes quantités de données, et je fournis ces systèmes aux clients. Je teste, simule, débogue et dépanne le nouveau code, et je résous les problèmes de plusieurs projets différents. Plus particulièrement, je suis la première personne à tester les projets d’équipe qui comportent le CHP ou à jouer le rôle de cobaye.
Recherche et / ou projets en cours
Au moment où j’écris ces lignes, je participe activement à deux grands projets de l’équipe de traitement de texte multilingue : le projet sur les technologies pour les langues autochtones et le projet de traduction automatique Portage.
Pour un aperçu général du projet sur les technologies pour les langues autochtones, voir la page intitulée Projet sur les technologies pour les langues autochtones canadiennes – CNRC. Ma participation au projet sur les technologies pour les langues autochtones concerne principalement deux sous-projets :
- Le développement du logiciel de studio de lecture accompagnée : Studio de lecture accompagnée — une application pour les livres audio et les vidéos dans les langues autochtones — CNRC. Le studio de lecture accompagnée est une application d’extension en ligne pour les livres audio en langues autochtones développée par le CNRC, l’Université Carleton et des collaborateurs autochtones. Les mots à l’écran sont surlignés lorsqu’ils sont lus ou chantés à voix haute. Le lecteur peut cliquer sur n’importe quel mot pour entendre sa prononciation. J’ai eu le plaisir de travailler sur les défis techniques associés à l’alignement de la parole sur le texte dans une variété de langues autochtones.
- La synthèse vocale pour appuyer l’enseignement des langues autochtones – CNRC. Ce sous-projet passionnant explore la possibilité de produire un discours synthétisé de haute qualité pour trois langues autochtones non apparentées et parlées dans différentes régions du pays. S’il se concrétise, il pourrait ouvrir la voie à la création d’une parole artificielle dans de nombreuses langues différentes parlées à l’échelle du Canada. Nous travaillons avec les enseignants des trois communautés pour déterminer comment cette capacité peut être utilisée pour faire progresser l’enseignement des langues. Mon rôle ici a consisté à tester le logiciel et à travailler en étroite collaboration avec son principal créateur, Aidan Pine, afin d’accélérer la formation des systèmes de synthèse vocale et d’éliminer les bogues.
Le projet de traduction automatique Portage : de 2004 à 2017 environ, ce projet s’est attaché à construire l’un des meilleurs systèmes de traduction automatique au monde, basé sur le paradigme statistique de la traduction automatique alors dominant. Cette phase du projet a donné naissance à plusieurs outils précieux, dont certains sont encore utilisés : GitHub – nrc-cnrc/PortageTextProcessing : Text processing tools that came out of the Portage SMT project – Outils de traitement de texte issus du projet Portage de TAS. Cependant, à peu près au moment où j’ai commencé à travailler au CNRC (2016), l’ensemble du domaine de la traduction automatique (TA) subissait un changement de paradigme, vers des méthodes basées sur des systèmes neuronaux et d’apprentissage profond. Le projet Portage se concentre désormais sur ces méthodes également. Mon rôle dans le projet a donc consisté à bâtir et à tester des systèmes de traduction automatique neuronale :
- J’aide l’un de nos plus importants clients, la Chambre des communes, à intégrer dans son pipeline un nouveau système de TA neuronale que j’ai formé; il présentera des suggestions de traduction à ses traducteurs. Il remplace un ancien système de TA statistique.
- Le sous-projet Jessica : le Bureau de la traduction du gouvernement fédéral nous a donné accès à un énorme corpus de traductions anglais-français antérieures. Ces traductions ne sont pas toutes de bonne qualité. J’explore diverses techniques de filtrage sur cet énorme corpus, en vue de trouver le sous-ensemble optimal qui permettra de former un système de TA neuronale pour la traduction entre les deux langues (dans les deux sens).
Énoncés de recherches / projets
Prix
2021 – Prix de reconnaissance pour réalisations en matière de propriété intellectuelle du CNRC pour les contributions percutantes en matière de logiciel ouvert
2021 – Prix instantané du CNRC/Technologies numériques
2016 – Finalistes des Prix de distinction dans le cadre d’une conférence/exposition sur la technologie dans l’administration gouvernementale (GTEC) pour l’année 2016
2015 – Prix d’excellence de la fonction publique
2015 – Finalistes des Prix de distinction GTEC pour l’année 2015
2012 – Finalistes des Prix de distinction GTEC pour l’année 2012
2012 – Prix Innovation du Bureau de la traduction
2010 – Finalistes des Prix de distinction GTEC pour l’année 2010
2009 – Prix d’excellence de TPSGC
2006 – Prix de reconnaissance pour la Journée mondiale de la traduction
2004 – Prix de la qualité du service du Bureau de la traduction