Rôles et responsabilités
Je suis agent de recherches au sein de l’équipe Traitement multilingue de textes du Centre de recherche en technologies numériques (TN) du Conseil national de recherches Canada (CNRC).
Recherche et / ou projets en cours
Les travaux que je mène actuellement portent sur la traduction automatique (TA). Depuis quelques années, j’occupe le rôle de chef de projet dans le cadre de collaborations entre le Conseil national de recherches Canada (CNRC) et le Bureau de la traduction du gouvernement du Canada. Je m’intéresse également depuis peu au domaine de la lisibilité des textes, soit à l’évaluation automatique de la lisibilité et à la simplification des textes.
Énoncés de recherches / projets
- Traduction automatique et assistée par ordinateur. Cela comprend la création de systèmes de traduction automatique neuronale (TAN) de haute qualité afin de soutenir le travail de traducteurs professionnels; l'évaluation de la qualité des traductions automatiques et la mise en évidence d’erreurs potentielles (« estimation de la qualité de la TA »), ainsi que l’exploitation de la rétroaction des traducteurs afin d’améliorer la qualité des traductions (« apprentissage continu »).
- Filtrage de corpus parallèles. Créer des données d’entraînement de haute qualité aux fins de la TA et d’autres applications de traitement de texte multilingue.
Études
- Doctorat en informatique, Université de Montréal, 2005.
- Maîtrise en informatique, Université McGill, 1990.
- Baccalauréat en mathématiques et en informatique, Université de Montréal, 1986.
Activités professionnelles / intérêts
- Directeur de recherche, Association for Machine Translation in the Americas (AMTA), 2012 à 2016
- Président de programme de la Conférence de 2014 de l’Association for Machine Translation in the Americas (AMTA 2014)
- Coprésident de programme (sous-domaine "multilinguality") lors de l’assemblée générale annuelle de 2011 de l’Association for Computational Linguistics (ACL 2011)
Affiliations
- Association for Computational Linguistics (ACL)
- Association for Machine Translation in the Americas (AMTA)
Principales publications
Une liste complète et disponible sur Google Scholar.
- Larkin, Samuel, Michel Simard, and Rebecca Knowles (2021). "Like Chalk and Cheese? On the Effects of Translationese in MT Training." Proceedings of the 18th Biennial Machine Translation Summit (Volume 1: Research Track).
- Lo, Chi-kiu, and Michel Simard (2019). "Fully unsupervised crosslingual semantic textual similarity metric based on BERT for identifying parallel data." Proceedings of the 23rd Conference on Computational Natural Language Learning (CoNLL).
- Littell, Patrick, Samuel Larkin, Darlene Stewart, Michel Simard, Cyril Goutte, and Chi-kiu Lo (2018). "Measuring sentence parallelism using Mahalanobis distances: The NRC unsupervised submissions to the WMT18 Parallel Corpus Filtering shared task." In Proceedings of the Third Conference on Machine Translation: Shared Task Papers, pp. 900-907.
Expérience de travail antérieure
2003 à 2005
Xerox Research Centre Europe (XRCE -- maintenant Naver Labs Europe), Grenoble, France.
Chercheur postdoctoral
1996 à 2003
Laboratoire RALI, Université de Montréal, Montréal (Québec).
Chercheur
1989 à 1996
Centre d’innovation en technologies de l’information (CITI), Industrie Canada, Laval (Québec).
Informaticien